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摘 要 多 模 态 数据 为 实现 对 认 知 结构 的 精准 诊断 及 其 他 认 知 特征 (如 , 认 知 风格 ) 的 全 面 反馈 提供 了 
可 能 性 。 为 实现 对 题目 作答 精度 、 作 答 时 间 (RT 和 视觉 注视 点 数 (EC) 的 联合 分 析 ， 本 文 基于 联合 -交叉 
负载 建 模 法 提出 三 个 多 模 态 认 知 诊断 模型 。 实 证 研究 及 模拟 研究 结果 表明 : (1) 联 合 分 析 比 分 离 分 析 更 
适用 于 多 模 态 数据 ; (2) 新 模型 可 直接 利用 RT 和 FC 中 信息 提高 潜在 能 力 或 潜在 属性 的 估计 准确 性 ; (3) 
新 模型 的 参数 估计 返 真 性 较 好 ; (4 忽略 交叉 负载 所 导致 的 负面 结果 比 元 余 考 虑 交叉 负载 所 导致 的 更 严 
重 。 
关键 词 ” 认 知 诊断 ， 多 模 态 数据 ,题目 作答 时 间 , 注视 点 ， 学 习 风 格 ， 眼 动 
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1 引言 

个 体 的 外 显 行 为 (如 ,学 习 行 为 或 问题 解决 行为 ) 是 由 相互 关联 的 多 种 认 知 过 程 及 心理 建构 所 共 局 
决定 的 。 因 此 ， 在 特定 问题 (任务 ) 情 境 下 ， 对 问题 解决 行为 的 合理 分 析 不 仅 可 以 挖掘 个 体 的 认 知 结构 ， 
还 能 反映 个 体 的 认 知 风格 或 认 知 流畅 性 等 其 他 认 知 特征 。 认 知 风 格 是 个 体 组 织 和 处 理 信 息 的 特征 及 相 
对 稳定 的 方式 ， 反 映 了 个 体 在 感知 、 记 忆 、 思 维 、 判 断 和 解决 问题 等 方面 的 偏好 或 典型 模式 (Riding， 
1997)， 有 助 于 调节 认 知 加 工 过 程 的 持续 时 间 、 强 度 、 范 围 和 速度 (Gardner et al., 1959; Messick, 1989). 
比如 , 根据 个 体 加 工 信 息 或 解决 问题 的 速度 和 精度 , 可 将 个 体 分 为 沉思 型 或 冲动 型 (Kagan, 1965); 通常 ， 
沉思 型 个 体 反 映 速度 较 慢 但 精度 较 高 ， 而 冲动 型 个 体 反应 速度 较 快 但 容易 发 生 错 误 。 再 比如 ， 根 据 个 
体 注意 力 的 广度 和 专注 度 ， 可 将 个 体 分 为 扫描 者 和 聚焦 者 (Gardner et al., 1959)。 在 解决 问题 时 ,扫描 者 
的 注意 力 广 度 宽 但 专注 度 低 ， 而 聚焦 者 的 注意 力 广度 窗 但 专注 度 高 。 有 研究 表明 在 解决 问题 时 扫描 者 
的 精度 高 于 聚焦 者 的 (Gardner et al., 1959; Holzman, 1966); 另 有 研究 指出 聚焦 者 对 目标 的 注意 力 持续 时 
间 久 于 扫描 者 (Raheef & Zainab, 2009， 也 见 Rimawi et al., 2020)。 也 有 研究 认为 扫描 和 聚焦 是 两 种 可 分 
离 的 风格 (Messick, 1989)， 根 据 扫描 范围 ( 即 注意 力 广 度 ) 可 将 个 体 分 为 罕 扫 描 者 和 宽 扫 描 者 ， 根 据 聚 焦 
程度 ( 即 专注 度 ) 可 将 个 体 分 为 聚焦 者 和 非 聚 焦 者 ; 而 且 ， 两 种 风格 还 能 相互 组 合 。 与 具有 相对 稳定 性 的 
认 知 风格 不 同 ， 认 知 流畅 性 通常 是 指 个 体 对 信息 处 理 或 解决 问题 的 难 易 程 度 的 主观 体验 (Unkelbach, 
2006), 流畅 性 可 能 会 随 所 处 理 的 信息 、 所 解决 的 问题 或 所 属 的 领域 的 不 同 而 不 同 (Biancarosa & Shanley, 
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2015)。 通 常 ， 在 有 关 流 畅 性 测量 的 研究 中 ， 流 畅 性 被 视 为 一 种 速度 和 精度 的 综合 反映 。 已 有 研究 表明 
达到 流畅 性 水 平 的 个 体 可 以 又 快 又 好 地 解决 问题 (Wang & Chen, 2020)。 总 之 ， 为 实现 对 个 体 学 习 现 状 
的 全 面 反馈 ， 对 个 体 问题 解决 行为 的 分 析 应 尝试 从 多 视角 切入 ， 不 仅 提 供 可 反映 认 知 结构 的 ， 还 要 提 
供 可 反映 认 知 风格 或 认 知 流畅 性 等 其 他 认 知 特征 的 反馈 信息 。 

近 些 年 ， 以 促进 个 体 学 习 为 目的 ， 客 观 量化 个 体 学 习 现 状 并 提供 诊断 反馈 的 测评 模式 日 益 受 到 关 
注 。 其 中 ， 认 知 诊断 作为 一 种 有 代表 性 的 诊断 测评 方式 ， 主 要 功能 是 诊断 个 体 的 学 习 现 状 (如 ,知识 掌 
握 程度 ) 并 提供 相应 的 反馈 ， 为 促进 个 体 学 习 提供 了 方法 学 支持 (Ren et al., 2021; Tang & Zhan, 2021; E 
立 君 等 , 2020)。 作 为 认 知 诊断 的 核心 技术 环节 之 一 , 认 知 诊断 模型 (cognitive diagnosis model, CDM) 或 诊 
断 分 类 模型 的 合理 性 影响 着 诊断 结果 的 准确 性 、 有 效 性 和 可 解释 性 。CDM 作为 一 种 有 约束 的 潜在 类 别 
模型 ， 描 述 了 潜在 属性 和 外 显 题目 作答 行为 之 间 概 率 关 系 。 通常 ,潜在 属性 为 类 别 变量 (如 ,“0” 表 示 “ 未 
掌握 *，“1” 表 示 “ 掌 握 *”)， 是 根据 个 体 完 成 复杂 学 习 任 务 或 解决 复杂 问题 时 所 需 县 备 的 潜在 技能 或 知识 
来 确定 的 。 目 前 , 针对 不 同 的 测验 情境 和 理论 假设 , 已 有 许多 CDM 被 提出 (Rupp et al., 2010; von Davier 
& Lee, 2019)， 比 如 常见 的 DINA 模型 (Junker & Sijtsma, 2001) 及 其 一 般 化 模型 (de la Torre, 2011)。 然 而 ， 
绝 大 多 数 CDM 是 基于 题目 作答 精度 (esponse accuracy, RA) 这 种 单一 且 传 统 的 数据 源 开发 的 ( 詹 沛 达 ， 
2018)， 导 致 它们 所 提供 的 诊断 反馈 范围 有 限 : 仅 关 注 对 问题 解决 所 需 的 认 知 技能 或 学 科 知 识 的 诊断 ， 
= 仅 能 提供 可 反映 认 知 结构 的 反馈 信息 ; 忽略 问题 解决 时 的 信息 加 工 速度 和 专注 力 (或 视觉 参与 度 ) 等 其 他 
= 相关 建构 ， 难 以 提供 可 反映 认 知 风格 或 认 知 流畅 性 等 其 他 认 知 特征 的 反馈 信息 。 换 句 话 说， 目前 绝 大 
多 数 CDM 提供 的 反馈 信息 有 限 , 不 能 全 面 反 映 个 体 间 学 习 现 状 之 间 的 差异 , 进而 可 能 限制 有 针对 性 干 
预 的 效果 。 导致 这 种 局 限 性 的 可 能 原因 之 一 是 在 传统 的 (基于 纸 笔 测验 的 ) 认 知 诊断 测评 中 很 难 采集 到 诸 
如 题目 作答 时 间 (response time, RT) 等 数据 。 

近 些 年 ， 随 着 计算 机 (网 络 ) 化 测验 的 普及 ， 对 过 程 数据 的 采集 已 趋 于 常态 化 。 过 程 数据 是 指 由 计生 
机 记录 的 反映 个 体 问题 解决 过 程 的 含有 时 间 戳 的 行为 序列 数据 (Zhan & Qiao, 2020; Zoanetti, 2010; 李 美 
娟 等 , 2020; XII, 2022)。 对 过 程 数据 的 分 析 不 仅 可 以 挖掘 个 体 的 问题 解决 策略 (Qiao & Jiao, 2018; 
Zhu et al., 2016)， 还 可 以 探究 个 体 的 问题 解决 能 力 (Liu et al., 2018; Zhan & Qiao, 2020)。 目 前 ，RT 数据 
作为 一 种 有 代表 性 的 过 程 数据 ， 因 为 其 具有 标准 化 数据 结构 !， 符 合 心 理 计量 模型 的 建 模 与 分 析 要 求 ， 
得 到 了 研究 者 们 的 高 度 关 注 。 已 有 研究 表明 ，RT 数据 作为 传统 RA 数据 的 补充 ， 不 仅 能 够 提供 个 体 在 
问题 解决 过 程 中 的 加 工 速度 信息 , 还 可 以 提高 对 潜在 能 力 的 估计 精度 (Bolsiova & Tijmstra, 2018; fS tix, 
2019) 和 潜在 属性 的 分 类 准确 性 (Zhan, Jiao et al., 2018) 。 实 际 上 ， 计 算 机 化 测验 的 自动 化 特性 使 得 它 能 
够 在 个 体 解 决 问题 过 程 中 实时 记录 不 限于 过 程 数据 的 多 种 类 型 数据 ， 即 多 模 态 数据 。 多 模 态 数据 是 指 
对 于 同一 个 描述 对 象 ， 通 过 多 种 仪器 、 测 量 设 备 或 采集 仪器 获得 到 的 互补 的 多 样 性 数据 (Lahat et al., 
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! 标准 化 数据 结构 是 指数 据 具 有 N x TEESE, AP N 表示 被 试 总 数 ，7 表示 题目 总 数 。 
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2015)。 比 如 ， 除 结果 数据 (如 , RA 数据 ) 和 过 程 数据 (如 , RT 数据 ) 外 ， 通 过 骨 入 式 传感器 或 实验 设备 (如 ， 
眼 动 仪 )， 计 算 机 化 测验 还 可 以 同步 记录 诸如 眼 动 、 身 体 运动 及 神经 活动 等 生物 计量 数据 。 生 物 计量 数 
据 可 用 于 提供 有 关 个 体 与 任务 情境 互动 效果 的 反馈 ， 比 如 ， 解 决 问题 时 个 体 的 视觉 参与 度 (Man & 
Harring, 2019; Zhan et al., 2021) 或 大 脑 激活 水 平 (Jeon et al. 2021)。 在 技术 增强 测评 环境 中 ， 随 着 多 模 态 
数据 采集 技术 的 不 断 发 展 ， 针 对 多 模 态 数据 的 联合 分 析 技 术 也 应 得 到 相应 的 关注 和 发 展 。 
但 是 ， 多 模 态 数据 的 分 析 也 给 心理 计量 模型 带 来 了 挑战 : 仅 凭 借 单 一 的 测量 模型 无 法 满足 分 析 多 
模 态 数据 的 需求 。 因 此 ， 在 智能 时 代 背 景 下 ， 基 于 技术 增强 测评 环境 ， 建 立 心 理 与 教育 测量 新 范式 ， 
探究 多 模 态 数据 分 析 方 法 具有 重要 的 理论 意义 和 实践 价值 。 对 此, 遵循 联合 -层级 建 模 法 (van der Linden, 
2007), Zhan 等 (2021) 基 于 联合 -层级 认 知 诊断 建 模 框架 (Zhan, Jiao et al., 2018) 提 出 了 联合 -层级 多 模 态 认 
知 诊断 模型 joint-hierarchical multimodal CDM, H-MCDM); 首次 在 认 知 诊断 领域 实现 对 结果 数据 、 过 程 
数据 和 生物 计量 数据 进行 联合 分 析 。 其 研究 结果 表明 联合 分 析 多 模 态 数据 不 仅 能 为 个 体 提供 更 全 面 的 
反馈 还 能 提高 诊断 精度 。 然 而 ，Ranger (2013) 指 出 联合 -层级 建 模 的 一 个 主要 理论 局 限 是 仅 当 潜在 变量 
之 间 的 相关 不 等 于 0 时 ， 各 模 态 数据 之 间 的 信息 才能 相互 被 利用 ; 进而 才 有 可 能 实现 利用 辅助 数据 所 
提供 的 信息 提高 对 核心 特质 (如 ,潜在 能 力 ) 的 估计 精度 (Bolsinova & Tijmstra, 2018)。 对 此 ， 有 研究 者 提 
出 联合 -交叉 负载 建 模 法 (Bolsinova & Tijmstra, 2018; Molenaar et al., 2015)。 联 合 -交叉 负载 建 模 法 可 视 为 
是 对 联合 -层级 建 模 法 的 拓 广 ， 理 论 上 可 以 通过 交叉 负载 实现 直接 利用 辅助 数据 (如 , RT) 为 核心 特质 (如 ， 
潜在 能 力 ) 提 供 信息 。 鉴 于 H-MCDM 是 遵循 联合 -层级 建 模 法 构建 的 ， 理 论 上 也 必然 存在 上 述 局 限 性 ; 
这 在 一 定 程度 上 可 能 会 影响 该 模型 的 实践 应 用 性 。 对 此 ， 本 文 聚 焦 于 认 知 诊断 领域 ， 针 对 结果 数据 、 
过 程 数 据 和 生物 计量 数据 ， 拟 基于 联合 -交叉 负载 建 模 法 构建 多 模 态 认 知 诊断 模型 (joint-cross-loading 
MCDM, C-MCDM). 

首先 , 简单 回顾 两 种 可 联合 分 析 多 模 态 数据 的 联合 建 模 法 : 联合 -层级 建 模 法 和 联合 -交叉 负载 建 模 
ik. 其 次 ,简单 介绍 视觉 注视 点 数 (visual fixation count, FC)， 一 个 重要 的 眼 动 指标 ， 然 后 ， 以 传统 的 分 
离 建 模 法 为 始 ， 分 别 介 绍 有 关 RA、RT 和 FC 数据 的 测量 模型 ， 继 而 引出 H-MCDM; KA, ERRI 
究 新 提出 的 三 个 C-MCDM， 基 于 实证 研究 将 新 模型 与 已 有 模型 进行 对 比分 布 以 展现 新 模型 的 现实 可 应 
用 性 及 相对 优势 ， 并 通过 两 则 模拟 研究 分 别 探究 新 模型 的 参数 估计 返 真 性 和 相对 于 HMCDM 的 优势 ; 
最 后 ， 总 结 了 研究 结果 并 探讨 了 未 来 的 研究 方向 。 
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2 多 模 态 数据 的 联合 分 析 

2.1 两 种 联合 建 模 框架 

目前 ， 联 合 -层级 建 模 是 使 用 最 广泛 的 联合 分 析 多 模 态 数据 的 心理 计量 建 模 方法 ， 如 图 1(a) 所 示 。 
如 上 文 所 述 ，RT 数据 作为 一 种 有 代表 性 的 过 程 数据 近 些 年 受到 高 度 关注 ， 研 究 者 们 提出 了 多 个 可 联合 
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分 析 RA 和 RT 数据 的 联合 -层级 模型 (De Boeck & Jeon, 2019; 552255, 2017; 詹 沛 达 , 2018)。 在 典型 的 联 


合 -层级 建 模 中 ,第 一 层 中 构建 RA 数据 和 RT 数据 的 测量 模型 : 潜在 能 力 完 全 解释 RA 数据 ， 潜 在 加 工 


速度 完全 解释 RT 数据 ; 而 潜在 能 力 和 潜在 加 工 速度 之 间 的 关系 以 二 元 正 态 分 布 的 形式 被 建 模 在 第 二 层 
结构 模型 中 。 尽 管 几 乎 所 有 的 联合 -层级 模型 都 局 限于 分 析 RA 和 RT 这 两 类 数据 ， 但 由 于 该 建 模 思路 


具有 较 强 的 可 扩展 性 ， 基于 该 建 模 框 架 可 以 实现 对 更 多 类 型 数据 的 分 析 和 对 更 多 类 型 潜在 建构 的 测量 。 


比如 ，Jeon 等 (2021) 通 过 联合 分 析 RA 数据 和 大 脑 激 活 这 一 生物 计量 数据 ,测量 了 个 体 的 潜在 能 力 和 大 
脑 激 活水 平 。Man 和 Harring (2020) 通 过 联合 分 析 RA 数据 、RT 数据 和 FC 数据 ， 测 量 了 个 体 的 潜在 能 
力 、 潜 在 加 工 速度 和 视觉 参与 度 。Bezirhan 等 (2021) 联 合 分 析 了 RA 数据 、RT 数据 和 重 访 题 目次 数 ， 


测量 了 个 体 的 潜在 能 力 、 洪 在 加 工 速度 和 重 访 题目 倾向 。 基 于 联合 -层级 建 模 ， 在 认 知 诊断 领域 ，Zhan 
和 Jiao 等 2018) 首 次 将 RT 数 据 引 入 认 知 诊断 建 模 中 提出 了 联合 -层级 认 知 诊断 建 模 框 架 , 如 图 1(b) 所 示 ; 
该 建 模 法 同样 具有 可 扩展 性 , 通过 加 入 其 他 模 态 数据 的 测量 模型 , 实现 多 模 态 数据 的 联合 分 析 (e.g., Zhan 


et al., 2021). 


与 仅 关注 的 RA 数据 的 传统 模型 相 比 ，Ranger (2013) 指 出 联合 -层级 建 模 的 主要 理论 局 限 是 仅 当 洪 
在 能 力 和 潜在 加 工 速度 之 间 的 相关 系数 不 等 于 0 时， 额外 引入 RT 数据 的 联合 -层级 模型 才能 够 提高 对 
潜在 能 力 参 数 的 估计 精度 。Bolsinova 和 Tijmstra (2018) 指 出 联合 -层级 建 模 未 充分 利用 RT 数据 所 提供 
的 信息 ， 即 假设 RT 数据 仅 受 潜在 加 工 速度 的 影响 ， 不 受 潜在 能 力 的 影响 。 然 而 ， 在 实际 测验 中 ， 可 能 
存在 潜在 能 力 和 潜在 加 工 速度 之 间 的 相关 系数 较 小 (Bolsinova et al., 2017; Zhan, Liao et al., 2018) 以 及 不 
同 能 力 的 个 体 在 解决 问题 时 所 花费 的 时 间 可 能 不 同 (Schaeffer et al., 1993) 的 情况 。 对 此 ， 联 合 -交叉 负载 


建 模 假设 RT 数据 同时 受 个 体 的 潜在 能 力 和 潜在 加 工 速度 的 影响 ， 如 图 1(c) 所 示 ; 理论 上 ， 无 论 潜在 能 


力 与 潜在 加 工 速度 之 间 的 相关 系数 多 大 ，RT 数据 都 可 以 直接 为 潜在 能 力 参 数 的 估计 提供 信息 ， 增 加 洪 


在 能 力 参 数 的 估计 精度 。 但 目 


工作 。 


前 ， 尚 未 有 研究 将 该 建 模 方法 引入 认 知 诊断 领域 ， 这 是 本 文 要 做 的 一 项 
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EN d 
X um] T| | 2 Kl]. | ¥ A| «l5 
(a) 联合 -层级 IRT 建 模 (b) 联合 -层级 认 知 诊断 建 模 


人 ? 
um d 


Y s Y; Ti t Ti 


TE: 6 为 潜在 能 力 ; t 为 潜在 加 工 速度 ; a 为 潜 


(c) 联合 -交叉 负载 IRT 建 模 (d) 联合 -交叉 负载 认 知 诊断 建 模 


图 1 多 模 态 联合 建 模 示 意图 (以 作答 精度 和 作答 时 间 数 据 为 例 ) 
在 属性 ;了 为 题目 作答 精度 ; T 为 题目 作答 时 间 ;7 为 题目 数量 ; K 为 属性 数量 ; IRT 为 项 目 反 应 理论 . 


2.2 注视 点 数 


是 被 天 注 较 多 的 一 种 ， 已 被 用 


Harring, 2019; Zhan et al., 2021 


2.3 多 模 态 数据 分 析 


= FETE EDLC MSP, ER A 8 n] Dido Se NY AE i Bi; ern. RA 


于 大 规模 测评 项 目 之 中 (Bos et al., 2005, 也 见 Rupp et al., 2010). Hi z/jd s 


可 以 提供 有 关 个 体 在 解决 问题 时 的 认 知 过 程 的 证 据 。 常 见 的 眼 动 指标 有 注视 点 (提供 眼睛 看 哪里 信息 )、 
眼 跳 (提供 注视 点 位 置 发 生变 化 的 信息 )、 感 兴趣 区 (提供 注视 点 聚集 区 域 的 信息 ) 和 回 视 次 数 (提供 个 体 将 
注视 点 返回 到 特定 目标 上 的 次 数 信息 ) 等 ， 其 中 ， 注 视点 是 最 常用 的 指标 ， 它 可 以 反映 个 体 对 视觉 目标 
区 域 的 专注 度 (An etal., 2017)， 或 视觉 目标 区 域 对 个 体 的 重要 性 和 吸引 力 (Poole et al., 2004). REEI 
© 算 机 化 测验 中 ， 作 答题 目 时 的 注视 点 数 ( 即 FC 数据 ) 可 以 反映 个 体 解决 问题 时 的 视觉 参与 度 (Man & 


)。 


本 文 以 分 析 RA 数据 、RT 数据 和 FC 数据 为 例 ， 涉 及 三 种 可 分 析 多 模 态 数据 的 建 模 法 : 分 离 建 模 


2.3.1 分 离 建 模 法 
分 离 建 模 法 延续 传统 心理 


法 ， 联 合 -层级 建 模 法 和 联合 -交叉 负载 建 模 法 。 


计量 学 模型 的 做 法 ， 对 不 同 模 态 的 数据 分 别 建 模 、 独 立 分 析 。 为 便于 下 


文 撰写 ， 将 采用 分 离 建 模 法 分 析 多 模 态 认 知 诊断 数据 的 方法 称 为 分 离 多 模 态 认 知 诊断 模型 (separate 
MCDM, S-MCDM)。 在 S-MCDM 中 ， 本 文选 用 三 个 具有 代表 性 的 测量 模型 分 别 来 分 析 RA 数据 、RT 


数据 和 FC 数据 。 


ChinaXiv 预 印 本 


首先 ， 选 用 高 阶 DINA (higher-order DINA, HO-DINA) (de la Torre & Douglas, 2004) 模 型 作为 RA 数 
据 的 测量 模型 ， 主 要 原因 是 为 与 基于 联合 -层级 建 模 法 的 H-MCDM 做 对 比 。HO-DINA 模型 可 描述 为 : 


POsDsg-(-s- gM, (1) 
logit(P(a,, 21)) 2 y,0, — Yor» (2) 
RP, Y, AMAA n 作答 题目 i 的 精度 ，g; 和 s; 分 别 为 题目 i 的 猜测 参数 和 失误 参数 ，n, = [TA at 为 被 


in 对 题目 i 的 理想 作 管 ; a 为 被 试 n 对 属性 k 的 掌握 情况 , one = 1 表示 “掌握 ”, One = 0 表示 “未 掌握 ”; 
qx 为 QJM PR, RANGA MRE k BAS AOL, quo 1 表示 “考查 ”"，gx = 0 RR RKE”; yi 
和 Yo 分 别 为 属性 的 区 分 度 参 数 和 难度 参数 ， 此 时 ， 被 试 的 潜在 能 力 水 平 越 高 ， 则 被 试 对 属性 的 掌握 概 
率 越 大 。HO-DINA 模型 假设 潜在 属性 之 间 满 足 连接 缩合 规则 ， 即 被 试 只 有 掌握 题目 所 考查 的 所 有 属性 
时 其 理想 作答 结果 才 是 1， 进 而 才 有 较 高 概率 正确 解决 问题 。 

其 次 ， 选 用 对 数 正 态 RT (lognormal RT, LRT) 模 型 (van der Linden, 2006) 作 为 RT 数据 的 测量 模型 ， 
该 模型 可 描述 为 : 


2 
Q; 0; 
T, f(t,1,,0,5,) = —= ex i (logt, -(E,-T,))’)> (3) 
"SLUT Si) 1 Jon p( 7 (logt — ($ ») 


WP, Ti ABA n 作答 题目 i 的 时 间 ( 常 以 秒 为 单位 ); 6; 为 被 试 n 的 潜在 加 工 速度 ,表示 被 试 投入 到 整 
个 测验 中 的 平均 工作 速度 ;8&6 为 题目 i 的 时 间 强 度 参 数 ， 表 示 完 成 题目 i 所 必需 的 时 间 ; @i; 为 题目 i 的 
时 间 精 度 参数 。LRT 模型 假设 当 被 试 的 潜在 加 工 速度 较 高 时 则 其 RT 较 小 。LRT 模型 也 可 简单 记 为 : 
T: (4) 

最 后 ， 为 实现 对 个 体 视 觉 参 与 度 的 测量 ，Man 和 Harring (2019) 提 出 了 可 分 析 FC 数据 的 负 二 项 注 
视点 (negative binomial fixation, NBF) 模 型 。NBF 模型 假设 FC 服从 负 二 项 分 布 ， 并 将 FC 解释 为 个 体 的 
视觉 参与 度 与 题目 所 需 的 必要 注视 点 数量 之 间 的 权衡 关系 的 产物 。NBF 模型 描述 了 被 试 n 在 作答 题目 
i 时 ， 在 贯 序 、 独 立 的 也 ;次 观察 后 成 功 提取 了 hi 次 关键 信息 的 概率 分 布 ， 即 : 


log(T,) ~ N(& -1 


Tv, +h) h, "C expe, +m) \" 

pTO) Ex (seme tm) (5) 
SH, Vu MOX n 解答 题目 i 时 的 FC，s; 为 被 试 n 的 潜在 视觉 参与 度 ， 可 反映 被 试 对 问题 情境 中 各 种 
刺激 的 专注 度 ; mi; 为 题目 i 的 视觉 强度 参数 ， 表 示 完 成 题目 i 所 必需 的 注视 点 数 ; hi 为 题目 i FC 的 
离散 程度 参数 。NBF 模型 也 可 简单 记 为 : 

V, ~ NB(exp(e, +m,), d;^). (6) 


ni 


u, = mh) 为 题目 的 视觉 区 分 度 参数 。NBF 模型 的 基本 假设 是 ， 对 于 特 


V ~ S Vni Ens hm) 


IT 


式 中 ， t= aa ( 


定 的 题目 ， 被 试 的 视觉 参与 度 越 高 则 其 在 该 题目 上 的 FC RE. NBF 模型 的 另 一 个 假设 是 被 试 对 测验 


[ em 
pm 
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中 所 有 题目 的 视觉 参与 度 是 恒定 的 ， 该 假设 类 似 于 LRT 模型 中 潜在 加 工 速度 恒定 的 假设 。 
2.3.2 联合 -层级 建 模 法 

近年 来 ， 人们 越 来 越 有 兴趣 去 结合 多 模 态 数据 所 提供 的 信息 对 感 兴趣 的 心理 现象 提供 统一 的 解释 。 
实际 上 ， 在 计算 机 化 测验 中 ， 对 RA 数据 、RT 数据 和 FC 数据 的 采集 几乎 是 同时 进行 的 ， 且 它们 提供 
的 是 被 试 在 作答 相同 题目 时 的 平行 信息 (如 ,被 试 正确 作答 某 题 目 耗 时 20 秒 并 投入 30 个 注视 点 ), 因此 ， 
也 有 研究 者 将 这 类 多 模 态 数据 称 之 为 平行 数据 (Jeon et al., 2021)。 平 行 数据 最 大 的 优势 在 于 它们 包含 有 
关 同 一 个 问题 解决 过 程 的 平行 信息 ， 如 果 这 些 信息 可 以 被 联合 分 析 并 相互 利用 ， 不 仅 可 以 直接 分 析 不 
同 潜在 变量 之 间 的 关系 ， 还 有 可 能 提高 各 自 测量 模型 的 参数 估计 准确 性 。 

基于 联合 -层级 认 知 诊断 建 模 ，Zhan 等 (2021) 提 出 可 同时 分 析 RA 数据 、RT 数据 和 FC 数据 的 
H-MCDM。 如 图 2(a) 所 示 ，H-MCDM 包含 两 层级 模型 :测量 模型 和 结构 模型 。 在 第 一 层 测量 模型 中 ， 
对 三 种 模 态 数据 分 别 建 模 ， 这 与 S-MCDM RW, ABBR, 在 第 二 层 结构 模型 中 ， 通 过 三 元 正 态 分 布 
来 描述 潜在 能 力 、 潜 在 加 工 速度 和 潜在 视觉 参与 度 三 者 之 间 的 关系 : 


0, Ho o, 
o, =| Ta M H; j È ends ? È person =| G0. Oi > (7) 
2 
E, Hs Obe Ox 9, 


式 中 » lperson = (Le, Ur, be) 为 三 个 潜在 变量 的 均值 向 量 ; Lperson 为 = 个 潜在 变量 的 方 差 协 方 差 矩阵 。 


2.3.3 联合 -交叉 负载 建 模 法 

如 上 文 所 述 ， 联 合 -层级 建 模 的 主要 局 限 之 一 是 : 理论 上 ， 仅 当 潜 在 变量 之 间 相 关 不 为 0 时 ， 各 模 
态 属性 之 间 的 信息 才能 相互 被 利用 。 为 了 更 直接 地 利用 RT 和 FC 这 两 个 附属 数据 中 的 信息 ， 可 使 用 联 
合 -交叉 负载 建 模 法 ， 将 潜在 属性 或 潜在 能 力 直接 建 模 在 RT 测量 模型 和 FC 测量 模型 中 。 基 于 该 逻辑 ， 
本 文 提出 三 个 C-MCDM， 如 图 2(b)~2(d) 所 示 ， 分 别 为 基于 潜在 能 力 的 C-MCDM (C-MCDM-0)、 基 于 
连接 缩合 规则 的 C-MCDM (C-MCDM-D) 和 基于 补偿 缩合 规则 的 C-MCDM (C-MCDM-C)。 三 个 模型 遵 
循 不 同 的 逻辑 假设 ， 其 中 ，C-MCDM-6 假 设 被 试 的 潜在 能 力 的 变化 会 影响 其 完成 该 题目 的 耗 时 及 所 用 
注视 点 数 ; 而 C-MCDM-D 和 C-MCDM-C 均 假 设 被 试 的 潜在 属性 掌握 情况 会 影响 其 完成 该 题目 的 耗 时 
和 注视 点 数 ， 两 者 差异 在 于 前 者 认为 仅 有 被 试 掌握 了 题目 所 考查 的 所 有 属性 后 才 会 影响 RT 和 FC， 而 
后 者 认为 被 试 掌握 该 题目 所 考查 的 属性 的 数量 会 影响 RT 和 FC ( 即 掌 握 的 越 多 影响 越 大 )。 男 外 ， 为 保 
证 与 S-MCDM 和 H-MCDM 具有 可 比 性 , 本 文 设 定 在 C-MCDM-D 和 C-MCDM-C 中 也 存在 高 阶 潜在 结 
构 ， 但 是 否 存在 高 阶 潜在 结构 不 影响 建 模 。 再 有 ， 为 了 保证 模型 的 可 识别 性 ( 即 b, 和 6 之 间 的 以 及 0 和 
su 之 间 的 相关 性 已 经 被 交叉 负载 解释 )， 在 三 个 C-MCDM 中 并 没有 使 用 三 元 正 态 分 布 来 联接 潜在 能 力 、 
潜在 加 工 速度 和 潜在 视觉 参与 度 这 三 个 潜在 变量 (Bolsinova & Tijmstra, 2018; Molenaar et al., 2015). 小 
规模 模拟 研究 结果 显示 在 当前 C-MCDM 基础 上 再 采用 三 元 正太 分 布 联接 三 个 潜在 变量 后 会 导致 参数 


E 


Td 
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=> 


十 计 不 收敛 ， 尤 其 是 三 元 正太 分 布 中 的 方差 和 协 方 差 。 
为 便于 表达 ， 用 统一 模型 来 表示 三 个 C-MCDM。 首 先 ， 对 RA 数据 而 言 仍 选用 HO-DINA 模型 作 

为 其 测量 模型 ( 见 公 式 (3))。 其 次 ， 对 RT 数据 和 FC 数据 而 言 ， 它 们 的 测量 模型 可 分 别 表示 为 : 
log(T,,) ~ N(&,- 9,f(0,,,.q,)) -7T,), 0; )， (8) 
V,, ~ NB(exp((m; +2,f(8,,4,,4))) +€,) d;^). (9) 
RP, PAL (OS, On, qi) 表 示 对 于 考查 给 定 属性 的 题目 i， 潜 在 能 力 或 潜在 


遇 性 如 何 影响 其 RT Fl FC: 


aes 


0 for C- MCDM -0 


n 
K 


/£(0,.0,.4) -1 [Lo% for C-MCDM -D | (10) 

X One fr C- MCDM -C 
pi 入 分 别 为 函数 /0;, On, qi) et RT 和 FC 的 加 权 系 数 或 交叉 载荷 ， 以 C-MCDM-D 为 例 ，w 和 入 分 别 表 
示 ， 对 于 题目 i， 理 想 作答 为 1 的 被 试 和 理想 作答 为 0 的 被 试 之 间 (对 数 )RT 和 FC 的 均值 的 差异 。 鉴 于 
己 有 研究 表明 潜在 能 力 与 潜在 加 工 速度 之 间 并 不 总 是 正 相 关 (Zhan, Jiao et al., 2018)， 因 此 ， 三 个 模型 中 
并 不 限制 w A 的 正 负 号 ， 而 由 数据 驱动 决定 。 对 于 题目 六 当 w > 0 时 ,一定 程度 反映 了 题目 i 对 被 试 
作答 时 需 付 出 的 认 知 负荷 的 要 求 相对 较 低 (如 , 速度 测验 中 的 题目 )， 进 而 能 力 较 高 (或 属性 掌握 越 多 ) 的 
被 试 会 使 用 相对 更 少 的 时 间 来 作答 ， 而 能 力 较 低 的 被 试 会 使 用 相对 更 多 的 时 间 来 作答 ;而 当 w < 0 时 ， 
一 定 程度 反映 了 题目 i 对 被 试 作答 时 需 付 出 的 认 知 负荷 的 要 求 相对 较 高 (如 ,难度 测验 中 的 题目 )， 进 而 
能 力 较 高 的 被 试 会 使 用 相对 更 多 的 时 间 来 作答 ， 而 能 力 较 低 的 被 试 会 使 用 相对 更 少 的 时 间 来 作答 (可 能 
是 动机 较 低 导致 的 (Wise & Kong, 2005; Zhan, Jiao et al., 2018))。 同 理 ， 对 于 题目 i， 当 和 ;>0 时 ， 一 定 程 
度 反 映 了 题目 i 所 涉及 的 关键 信息 的 数量 较 多 , 进而 能 力 较 高 的 被 试 在 作答 该 题目 时 会 使 用 相对 更 多 的 
注视 点 ， 而 能 力 较 低 的 被 试 会 使 用 相对 较 少 的 注视 点 ( 即 难以 提取 到 所 有 的 关键 信息 );， 而 当 和 ;< 0 时 ， 
一 定 程度 反映 了 题目 i 所 涉及 的 关键 信息 的 数量 较 少 , 进而 能 力 较 高 的 被 试 在 作答 该 题目 时 会 使 用 相对 
更 少 的 注视 点 ， 而 能 力 较 低 的 被 试 会 使 用 相对 较 多 的 注视 点 (可 能 是 受到 无 关 信息 干扰 ， 难 以 确定 关键 
盲 息 的 位 置 )。 另 外 ， 由 于 gi; 入 是 同一 道 题目 的 参数 ， 所 以 理论 上 有 4 种 组 合 ， 如 表 1 所 示 ; 当然 ， 

表 1 中 的 描述 只 是 一 种 可 能 性 ， 实 践 中 还 需要 针对 具体 问题 具体 分 析 。 


py 


3X 1 C-MCDM 中 y; 和 和 参数 的 正 负 取 值 可 能 反映 的 题目 信息 . 
i 
>0 <0 
关键 信息 多 ， 认 知 负荷 要 求 低 : 关键 信息 少 ， 认 知 负荷 要 求 低 : 
>0 F /6 On, qi) 1, VW RTL, FCT; AT (On, On, Qi) tT» W RTL, FCI; 
l 若 fOn, On, Gi) Lo W RTT, FC}; F f(8,, On, qi) |, VW RTT, FCT; 
4 关键 信息 多 ， 认 知 负荷 要 求 高 : 关键 信息 少 ， 认 知 负荷 要 求 高 : 
<0 F /6 On, Qi) 1, Vl RTT, FCT; AT (On, On, qi) tT» VW RTT, FCI; 
F f0,, On, qi) L> M RTL, FCI; AT (On, On, qi) |» VW RTL, FCT; 
VE: oRDa 213] 73 ER C (5, On, qi) 对 RT 和 FC 的 交叉 载荷 ;6 为 潜在 能 力 ; o 为 潜在 属性 ; q 为 题目 所 考查 的 属性 ; T2338 


M JAFE: RT 为 题目 作答 时 间 ; FC 为 注视 点 数 . 
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另外 ,鉴于 在 认 知 诊断 中 提高 潜在 属性 的 诊断 准确 率 才 是 关键 ,三 个 C-MCDM 均 未 考虑 潜在 加 工 
速度 和 潜在 视觉 参与 度 对 RA 的 影响 , 即 不 考虑 利用 RA 数据 信息 提高 这 两 个 潜在 变量 的 参数 估计 准确 


性 ;也 没有 考虑 RT 数据 和 FC 数据 之 间 


言 息 的 相互 利用 ， 仍 假设 潜在 加 工 速 度 科 


存在 相关 。 此 时 ， 可 以 用 二 元 正 态 分 布 描述 潜在 加 工 速度 和 潜在 视觉 参与 度 之 间 


T 2 
9, — | 上 s urn ("| Ep) È person E E | ` 
£, H, O O; 


0 潜在 视觉 参与 度 之 间 
的 关系 : 


(11) 


nl. |E Tl | a | Tr Vil ow | Vr 


Yı T Y: T Ti Vi sen Vr 


(b) 基于 潜在 能 力 的 联合 -交叉 负载 多 模 态 认 知 诊断 模型 (C-MCDM-6) 


(a) 联合 -层级 多 模 态 认 知 诊断 模型 (HE-MCDMD 


II . 
CO e) > 
(ax 》 > c= As 
iw Suc eu. ng ec NE e ecc 
É | os Y; Ti T: V V; Yı Y: n.n Mi). | 


(c) 基于 连接 缩合 规则 的 联合 -交叉 负载 多 模 态 认 知 诊断 模型 (C-MCDM-D) (d) 基于 补偿 缩合 规则 的 联合 -交叉 负载 多 模 态 认 知 诊断 模型 (C-MCDM-C) 
图 2 联合 -层级 和 联合 -交叉 负载 多 模 态 认 知 诊断 建 模 示 意图 
: 6 为 潜在 能 力 ; 为 潜在 加 工 速度 ; s 为 潜在 视觉 参与 度 ，o 为 潜在 属性 ; Y. 为 题目 作答 精度 ; T 为 题目 作答 时 间 ; V. 为 注视 点 数 ; I 为 题目 数量 ; K 


2E BRE 


2.3.4 认 知 结构 诊断 及 认 知 特征 推断 

实际 上 ， 相 比 于 传统 的 仅 分 析 RA 数据 的 CDM 而 言 ，S-MCDM、H-MCDM 和 三 个 C-MCDM 25 
能 实现 对 多 模 态 数据 的 分 析 ， 研 究 者 也 均 可 以 基于 分 析 结 果实 现 对 个 体 认 知 结构 的 诊断 及 其 他 认 知 特 
征 的 推断 。 具 体 而 言 ， 首 先 ， 在 MCDM 中 ， 作 为 RA 数据 的 测量 模型 ，HO-DINA 模型 的 主要 功能 就 
是 诊断 个 体 对 潜在 属性 的 掌握 情况 ; 因此， 潜在 属性 模式 的 诊断 结果 可 以 较为 直接 地 反映 个 体 的 认 知 
结构 。 其 次 ， 在 MCDM 中 ， 人 额外 使 用 了 LRT 模型 和 NBF 模型 分 别 作为 RT 和 FC 数据 的 测量 模型 。 
与 HO-DINA 模型 中 将 被 试 参数 设 为 类 别 变 量 不 同 ，LRT 模型 和 NBF 模型 中 的 被 试 参数 为 连续 变量 ; 
因此 ， 无 法 像 对 潜在 属性 的 诊断 一 样 直 接 对 个 体 的 潜在 加 工 速度 和 潜在 视觉 参与 度 进行 分 类 ， 进 而 无 
法 直接 实现 对 个 体 认 知 特征 的 分 类 。 

对 此 ， 一 种 较为 简单 明了 的 方式 是 利用 均值 作为 切 点 : 当 个 体 的 潜在 能 力 大 于 均值 时 表明 该 个 体 
属于 认 知 能 力 (如 ,问题 解决 能 力 ) 相 对 较 高 的 一 类 ， 反 之 则 反 ; 当 个 体 的 潜在 加 工 速度 大 于 均值 时 表明 
该 个 体 属于 加 工 速度 相对 较 快 的 一 类 ， 反 之 则 反 ;， 当 个 体 的 潜在 视觉 参与 度 大 于 均值 时 表明 该 个 体 属 
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于 专注 度 较 高 的 一 类 ， 反 之 则 反 。 理 论 上 ,三 者 进一步 组 合 ， 可 得 到 8 种 认 知 特征 综合 类 别 (Zhan etal., 
2021); 表 2 呈现 了 这 8 种 认 知 特征 综合 类 别 及 可 能 的 原因 或 行为 表现 。 当 然 ， 需 要 强调 的 是 这 种 分 类 
方式 是 比较 粗糙 的 ， 适 用 于 对 个 体 认 知 特征 的 粗略 推断 ， 并 非 精确 的 测量 或 诊断 结果 。 


表 2 8 种 认 知 特征 综合 类 别 及 可 能 的 原因 或 行为 表现 (Zhan et al., 2021). 
0 T 8 认 知 特征 推断 可 能 的 原因 或 行为 表现 
+ E E 认 知 流畅 + 聚焦 者 有 人 能力 全 面 提取 题目 中 的 关键 信息 
+ + = 认 知 流畅 + 非 聚焦 者 有 人 能力 排 除 干扰 ， 提 取 题 目 中 少 有 的 关键 信息 
sk 一 | 沉思 型 + 聚焦 者 基于 已 提取 的 关键 信息 ， 对 可 能 问题 解决 方法 深思 熟 虑 
十 = - 沉思 型 + 非 聚焦 者 有 能 力 排除 和 干扰， 基于 少量 的 关键 信息 进行 深思 熟 虑 
一 + 十 冲动 型 + 聚焦 者 快速 提取 一 些 信息 ， 快 速 验证 问题 解决 方法 
一 + 一 冲动 型 + 非 聚焦 未 充分 提取 信息 ， 倾 向 于 快速 猜测 
B = * 认 知 不 流畅 + 聚焦 者 有 作答 动机 但 认 知 能 力 较 低 
一 一 一 认 知 不 流畅 + 非 聚焦 者 缺乏 作答 动机 


TE: 8 为 潜在 能 力 ; 为 潜在 加 工 速度 ; e 为 潜在 视觉 参与 度 ; + 为 大 于 均值 ; -为 小 于 均值 . 


2.4 贝 叶 斯 参数 估计 

本 文 使 用 全 贝 叶 斯 马尔 可 夫 链 蒙特 卡 洛 算法 对 S-MCDM、H-MCDM 和 三 个 C-MCDM 进行 参数 佑 
计 ， 并 基于 JAGS (Plummer, 2015) 实 现 。 附 录 S1 章节 中 呈现 了 模型 参数 估计 对 高 、 中 和 低 信息 先 验 分 
布 的 鲁 棒 性 分 析 结 果 ， 结 果 表 明 新 模型 对 包含 不 同 信息 量 的 先 验 分 布 具 有 一 定 的 鲁 棒 性 。 结 合 己 有 实 
证 数据 分 析 经 验 和 已 有 研究 结果 (Man & Harring, 2019; Zhan et al., 2021), 正文 所 有 参数 估计 均 采 用 中 信 
息 先 验 分 布 。 示 例 数 据 及 相应 的 JAGS 代码 已 分 享 在 附录 中 , 关于 如 何 使 用 JAGS 进行 贝 叶 斯 参数 估计 
可 参见 Zhan 等 (2019). 


c 3 实证 数据 分 析 

鉴于 本 文 所 提出 模型 中 包含 w Mu 两 个 新 参数 ， 暂 缺乏 对 它们 的 取 值 范围 的 了 解 ， 难 以 进行 恰当 的 
模拟 研究 ( 即 ， 不 知 根 据 何 种 分 布 来 生成 它们 的 真 值 ); 因此 需要 先进 行 实证 研究 ， 以 展现 新 模型 的 实践 
可 应 用 性 ， 并 为 模拟 研究 中 参数 真 值 生成 提供 参考 依据 。 
3.1 数据 描述 和 分 析 

为 对 比 三 种 多 模 态 数据 分 析 方 法 ( 即 5 个 MCDM) 的 表现 ， 我 们 选用 来 自 一 项 技术 增强 测评 环境 下 
的 数学 测验 的 数据 。 该 数据 ?在 美国 东海 岸 一 所 大 学 的 眼 动 实验 室 采集 的 (Man & Harring, 2019)， 其 中 包 
JE N=93 名 (矫正 ) 视 力 正常 的 大 个 体 对 T= 10 道 题目 的 作答 。 该 测验 考查 K= 4 个 潜在 属性 (Qa) 算数 
(arithmetic)、(02) 代 数 (algebra)、(03) 儿 何 (geometry) 和 (04) 数 据 分 析 (data analysis)， 测 验 Q 和 矩阵 见 图 3。 


H 


2 需要 强调 的 是 由 于 该 数据 中 涉及 到 某 高 利害 测验 中 敏感 信息 (例如 ， 题 目 )， 所 以 该 数据 并 不 对 外 公开 。 但 研究 者 可 以 
尝试 向 Man 和 Harring (2019) 或 Zhan 等 (2021) 的 通讯 作者 以 合理 的 理由 索取 。 
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该 数据 包含 三 种 同时 采集 的 数据 : 结果 数据 ( 即 RA)、 过 程 数据 ( 即 RT) 和 生物 计量 数据 ( 即 FC)。 男 外 ， 
关 该 数据 更 详细 的 描述 请 参阅 Man 和 Harring (2019)。 注 意 ，Man 和 Harring (2019) 使 用 的 是 语言 推 
理 数据 ， 而 Zhan 等 (2021) 及 本 文 使 用 的 是 同一 批 次 采集 的 数学 测验 数据 。 

分 别 使 用 S-MCDM、H-MCDM 和 三 个 C-MCDM 分 析 该 数据 。 五 个 模型 均 使 用 两 条 马尔 可 夫 链 ( 随 
机 起 点 )， 每 条 链 包含 60,000 次 迭代 ( 预 热 40,000 Ve), MBE 1; 最 终 剩余 40,000 次 迭代 用 于 计算 后 验 
均值 和 后 验 标准 差 。 使 用 潜在 量 尺 缩减 因子 (PSRF) < 1.2 (Brooks & Gelman, 1998) 作 为 参数 估计 收敛 检 
验 标准 (Brooks & Gelman, 1998; de la Torre & Douglas, 2004)。 使 用 后 验 预 测 模型 检验 (posterior predictive 
model checking) (PPMC; Gelman et al., 2014) 来 评估 模型 -数据 绝对 拟 合 ， 其 中 后 验 预测 概率 (posterior 
predictive probability, ppp) 接 近 0.5 表示 模型 与 数据 拟 合 (通常 ，ppp < 0.05 或 ppp > 0.95 可 被 视 为 不 拟 合 
(Gelman et al., 2014)). TE PPMC 中 使 用 测验 统计 量 (test statistics) ( 即 仅 关注 真实 数据 与 预测 数据 之 间 的 
差异 , 不 涉及 具体 模型 参数 ) (Levy & Mislevy, 2016)。 由 于 目前 缺乏 针对 联合 模型 的 绝对 拟 合 评价 指标 ， 
在 三 个 模型 中 ， 我 们 均 分 别 评估 不 同 模 态 数据 与 其 测量 模型 之 间 的 拟 合 关 系 。 此 外 ， 使 用 DIC 作为 模 
型 -数据 的 相对 拟 合 指标 用 于 模型 选择 ， 两 指标 都 是 指标 值 越 小 表示 模型 与 数据 拟 合 的 越 好 。 


1 2 3 4 5 6 7 8 9 10 
01 | 
02 | 
03 
Q4 


图 3 实证 数据 QEM HERR, KERRI. 
3.2 结果 
#3 呈现 了 5 个 多 模 态 模型 对 该 数据 的 拟 合 情 况 。 需 要 强调 的 是 ， 由 于 C-MCDM-D 中 约 39.71% 


的 待 估计 参数 (包括 gi, si, En On mi, di, Qi, iy Yok Yik Onks On, Tn En OF, 02, 02, Ogrs Oge, Ore) FH 
C-MCDM-C 中 约 29.35% 的 待 估计 参数 (同上 ) 并 未 达到 收敛 标准 (PSRF < 1.2)， 因 此 ， 这 两 个 模型 与 
数据 的 拟 合 结果 仅 供 参考 ， 在 实证 研究 中 不 再 参与 后 续 探 讨 。 首 先 ， 根 据 ppp 值 ， 表 明 S-MCDM、 
H-MCDM 和 C-MCDM-6 中 的 测量 模型 均 拟 合 该 数据 。 进一步 , DIC 指标 值 判断 C-MCDM-6 对 该 数据 
的 相对 拟 合 最 好 ，HMCDM 其 次 ，S-MCDM 最 差 。 该 结果 说 明 ， 对 于 提供 平行 信息 的 多 模 态 数据 
而 言 ， 两 种 联合 建 模 法 均 比分 离 建 模 法 的 表现 更 优 ， 且 基于 联合 -交叉 负载 建 模 法 的 C-MCDM X 
现 优 于 基于 联合 -层级 建 模 法 的 H-MCDM. 

通过 观察 H-MCDM 中 潜在 能 力 与 潜在 加 工 速度 的 估计 值 之 间 的 相关 系数 (0.008, SE = 0.278) 
和 潜在 能 力 与 潜在 视觉 参与 度 的 估计 值 之 间 的 相关 系数 (0.004, SE = 0.252)， 可 发 现 两 相关 系数 均 
接近 于 0， 理 论 上 难以 发 挥 H-MCDM 相 较 于 S-MCDM 的 优势 ， 反 观 ， 由 于 C-MCDM-6 可 以 直接 
利用 RT 和 FC 数据 中 的 信息 来 降低 对 潜在 能 力 参 数 的 估计 标准 误 ( 见 图 4)， 所 以 导致 该 模型 对 数 
据 的 拟 合 相 对 更 好 。 下 文 将 基于 C-MCDM-9 模 型 的 分 析 结 果 进 行 阐述 。 
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表 4 呈现 了 C-MCDM-6 模 型 中 三 个 测量 模型 的 参数 估计 值 及 pw 和 7X 的 估计 值 。 首 先 ， 对 测量 模 
型 中 参数 而 言 ， 该 结果 与 Zhan 等 2021) 的 估计 结果 基本 一 致 。 其 中 ， 前 两 题 的 猜测 参数 较 大 ， 而 

第 6 题 的 失误 参数 较 大 。 各 题目 的 时 间 强 度 参数 的 平均 值 约 为 3.33， 表 明 被 试 完成 这 些 题 目 所 必 
须 的 平均 耗 时 约 为 28 秒 (接近 该 数据 中 RT 的 均值 33.99)。 各 题目 的 视觉 强度 参数 的 平均 值 约 为 
4.68， 表 明 被 试 完 成 这 些 题目 所 必须 的 注视 点 数 约 为 107 个 (接近 该 数据 中 FC 的 均值 114.53)。 其 
UG. Mo 和 入 而 言 ， 一 个 显著 特点 是 对 于 同一 道 题目 两 参数 的 正 负 号 相反 。 结 合 表 1 中 的 描述 ， 表 明 
该 测验 中 题目 所 包含 的 关键 信息 数量 与 认 知 负荷 要 求 相 匹配 ， 即 关键 信息 多 则 认 知 负 符 要 求 高 ， 反 之 
则 反 。 进 一 步 ， 图 5 呈现 9; 和 入 的 估计 值 分 布 。 发 现 g 估计 值 的 中 位 数 <0， 一 定 程度 反映 该 测验 中 多 
数 题 目的 认 知 负荷 要 求 相 对 较 高 ， 进 而 个 体 的 潜在 能 力 越 高 则 其 解 题 时 所 消耗 的 时 间 越 长 ， 另外， 发 
现 和 估计 值 的 中 位 数 > 0， 一 定 程度 反映 该 测验 中 多 数 题 目 所 包含 的 关键 信息 数量 较 多 ， 进 而 个 体 的 潜 
在 能 力 越 高 则 其 解 题 时 所 呈现 的 注视 点 数 越 多 。 

表 5 呈现 了 基于 C-MCDM-6 模 型 的 反馈 样 例 , 包括 对 认 知 结构 和 其 他 认 知 特征 的 反馈 信息 ， 以 
展现 联合 分 析 多 模 态 数 据 的 优势 。 以 被 试 5、10 和 65 为 例 ，3 人 在 潜在 属性 上 的 诊断 结构 相同 ， 
但 他 /她 们 在 潜在 能 力 、 潜 在 加 工 速 度 和 潜在 视觉 参与 度 上 的 估计 值 有 较 大 差异 ， 这 表明 即便 他 / 
她 们 具有 相同 的 认 知 结构 ， 他 /她 们 在 认 知 风格 或 认 知 流畅 性 等 认 知 特征 方面 也 可 能 不 同 。 另 外 ， 
对 于 认 知 结构 有 缺失 的 被 试 ， 若 实施 有 针对 性 干预， 除 缺 失 的 潜在 属性 外 ， 还 应 考虑 不 同 个 体 的 
认 知 特征 ， 采取 更 恰当 的 干预 措施 。 比 如 , 被 试 34 和 67 均 缺 失 属性 2 和 4， 但 由 于 两 者 的 认 知 特 
征 不 同 , 或 许可 以 尝试 不 同 的 有 针对 性 干预 措施 。 对 于 被 试 34 (冲动 型 + 非 聚 焦 者 ) 而 言 ， 由 于 其 倾 
向 于 仅 根 据 从 问题 情境 中 提取 的 部 分 信息 就 仓促 做 出 决定 ， 除 缺失 的 潜在 属性 外 ， 还 可 以 尝试 培 
养 该 被 试 的 视觉 参与 度 ， 并 鼓励 其 认真 审题 、 谨 慎 作 符 。 而 被 试 67 ( 认 知 不 流畅 + 聚焦 者 ) 似 乎 有 解 
决 问题 的 动机 或 欲望 但 由 于 能 力 有 限 即 便 视觉 参与 度 较 高 也 无 法 提取 题目 中 的 关键 信息 ， 所 以 对 
该 被 试 而 言 ， 应 该 着 重 补救 其 所 缺失 的 潜在 属性 。 

表 3 实证 数据 中 模型 -数据 拟 合 指标 . 


baal 


Model -2LL DIC ppp RA Dpp RT ppp FC 
S-MCDM 11104.13 11890.70 0.42 0.52 0.78 
H-MCDM 11040.62 11804.00 0.42 0.51 0.57 

C-MCDM-0 10275.27 11542.78 0.43 0.51 0.68 
C-MCDM-D 10127.21 10549.14 0.40 0.52 0.64 


C-MCDM-C 10009.65 10434.95 0.36 0.51 0.67 
ik: -2LL = -2 log likelihood; DIC = deviance information criterion; ppp = 后 验 预测 概率 ; RA = 作答 精度 ; RT = 作答 时 间 ; 
FC = 注视 点 数 . 
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04 


0.2 


S-MCDM H-MCDM C-MCDM-9 


图 4 实证 数据 中 潜在 能 力 参 数 估计 后 验 标准 差 (标准 误 ) 


IT 


表 4 实证 数据 中 C-MCDM-6 模 型 的 题目 参数 估计 值 


amu 8 作答 精度 作答 时 间 注视 点 数 
JR zm 4 As 
ry | 十 g M E (Q) m d 

1 (1010) 0.71 (0.23) 0.06 (0.04) 2.89 (0.04) 3.78 (0.340) 4.23 (0.04) 0.08 (0.011) 0.25 (0.05) —0.22 (0.04) 
2 (1100) 0.60 (0.22) 0.05 (0.04) 3.43 (0.05) 2.56 (0.20) 4.85 (0.04) 0.03 (0.002) —0.07 (0.06) 0.13 (0.04) 
3 (1100) 0.33 (0.13) 0.38 (0.11) 2.60 (0.06) 2.65 (0.25) 3.87 (0.05) 0.07 (0.010) 0.43 (0.07) —0.40 (0.05) 
4 (0100) 0.31(0.21) 0.18 (0.08) 3.34 (0.05) 2.56 (0.20) 4.68 (0.04) 0.03 (0.003) —0.11 (0.06) 0.15 (0.04) 
5 (0010) 0.49 (0.20) 0.25 (0.07) 3.13 (0.07) 1.83 (0.14) 4.50 (0.05) 0.03 (0.002) 0.21 (0.08) —0.18 (0.06) 
6 (0100) 0.09 (0.04) 0.86 (0.07) 3.08 (0.08) 3.14 (0.42) 4.42 (0.07) 0.05 (0.012) -0.65 (0.08) 0.61 (0.07) 
7 (0001) 0.43 (0.19) 0.22 (0.11) 3.74(0.06) 1.98 (0.16) 5.06 (0.05) 0.02 (0.001) -0.22 (0.07) 0.19 (0.06) 
8 (1001) 0.15 (0.08) 0.61 (0.16) 3.92 (0.06) 2.88 (0.29) 5.18 (0.06) 0.02 (0.002) -0.43 (0.07) 0.41 (0.06) 
9 (0001) 0.44 (0.13) 0.36 (0.10) 3.41 (0.10) 1.22 (0.10) 4.82 (0.07) 0.01 (0.001) —0.07 (0.12) 0.17 (0.08) 
10 (1001) 0.11 (0.06) 0.73 (0.15) 3.80 (0.12) 1.13 (0.10) 5.18 (0.09) 0.01 (0.001) 0.31 (0.14) -0.29 (0.10) 


注 :g = 猜测 参数 ; s = 失误 参数 ;5= 时 间 强度 参数 ; o = 时 间 精 度 参数 ; m = 视觉 强度 参数 ; 4= 视觉 区 分 度 参数 ; 括号 
内 为 标准 误 (后 验 标准 差 ). 


ey 
FH 
Æ ge 


0.6 


图 5 实证 数据 中 C-MCDM-0 模 型 的 9 和 和 估计 值 分 布 . 
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表 5 实证 数据 中 个 体 认 知 结构 诊断 及 其 他 认 知 特征 推 朵 样 例 . 

被 试 Qu a2 a3 Q4 0 t £ 认 知 特征 推断 

5 1 1 1 1 0.12 (0.25) -0.17 (0.11) 0.20 (0.09) 沉思 型 + 聚焦 者 

9 1 1 1 1 0.31 (0.23) 0.05 (0.11) 0.06(0.08) ” 认 知 流畅 + 聚焦 者 

34 1 0 1 0 -0.19 (0.26) 0.20 (0.11) —0.06 (0.08) ”冲动 型 + 非 聚 焦 

65 1 1 1 1 0.25 (0.24) 0.20 (0.11) -0.22 (0.09) ” 认 知 流畅 + 非 聚 焦 者 

67 1 0 1 0 —1.52 (0.27) -0.18 (0.11) 0.10 (0.09) ” 认 知 不 流畅 + 聚焦 者 

76 1 1 1 0 0.56 (0.25) -0.01 (0.11) -0.12 (0.09) ”沉思 型 + 非 聚焦 者 
ik: 0= 潜在 能 力 ; t= 潜在 加 工 速度 ; s = 潜在 视觉 参与 度 ; 括号 内 为 标准 误 ( 后 验 标准 差 ). 
4 模拟 研究 

上 文 已 经 通过 实证 研究 展示 了 新 模型 的 实用 性 及 相对 优势 。 本 节 通 过 两 则 模拟 研究 进一步 探究 新 
模型 的 心理 计量 学 性 能 。 其中, 研究 1 拟 在 多 种 模拟 测验 条 件 下 探究 新 模型 的 参数 估计 返 真 性 ; 研究 2 


拟 对 比 新 模型 


4.1 模拟 研究 1 
4.1.1 数据 生成 与 分 析 


模拟 研究 
研究 目前 可 


固定 潜在 属性 数量 
2021); (3) 交 叉 载 荷 CL: 入 = 


中 ， 设 定 三 个 操纵 变量 : (A 


能 的 被 试 数量 ， 本 研究 主要 关 沪 


T 


E. 
里 


本 
新 模型 在 小 样 


K=5, Q REIL KI 6 (X QH 
- 0. 0.2 fll 0.5, 


I 和 H-MCDM 的 相对 表现 ， 以 展现 新 模型 的 相对 优势 及 考虑 区 


iN: 


100 和 500， 考 虑 
本 条 件 下 的 表 
E 阵 满足 DINA 模型 的 参数 可 识别 性 要 求 (Gu & Xu, 
其 中 ，0.2 和 0.5 的 设 定 参考 实证 


a 


NA T my 


被 试 的 潜在 能 力 、 潜 在 加 ] 


-速度 和 潜 了 


~ MVN|| 01, 


该 设 定 中 pre = 


假设 个 体 的 加 了 
则 视觉 参与 度 越 低 ( 即 冲动 型 


是 在 交叉 
Ab. 
成 


-0.5 参考 了 上 文 实证 研究 结 


01 (1 
0 


0 


0.25 
0 


果 及 Zhan 和 Jiao 等 


[速度 越 慢 则 视觉 参 
EZ 


dr 


模 法 


负载 认 知 诊断 19512 


与 度 越 高 ( 即 沉思 


Fa FJ 


14 


视觉 参与 度 按 如 下 方法 生成 


—0.125 0.25 


型 多 匹配 聚焦 者 ); 同时 ， 个 体 学 习 的 加 了 
匹配 非 聚 焦 者 ); 另外 ， 遵 循 图 2(b)~2(qd) 中 的 设 定 ， 设 定 po: = 
间 的 关系 及 6 与 g 之 间 的 关系 已 经 | 


到 CDM 的 实际 应 
现 ; 


又 负载 的 必要 性 。 


场景 及 眼 动 
(2) 测 验 长 度 7: 15 和 30， 


数据 分 析 结 果 ( 见 表 


(12) 


(2018) 和 Man 和 Harring (2019) 的 设 定 : 


[速度 越 快 
0 All Poe =0, 
交叉 载荷 来 描述 。 


参考 上 文 实证 研究 结果 及 Zhan 等 (2018) 和 Man 和 Harring (2019) 的 设 定 , 题目 参数 按 如 下 方 
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XX; —2.197 1 

; 4.394 0.5 1 
Wij MVN | | 
$; 4 一 0.23 一 0.23 0.25 


m; 4 —0.25 -0.25 0.125 0.25 (13) 


此 时 ， 题 目 的 gi 和 $i 参数 分 别 为 8i = SEES URS 和 S; = 1 m iu E id 该 设 定 (pps =0.5、 PRE 


= 0.55 ppm ——0.5. pag — —0.5. pas — —0.5 FU Pem = 0.5) 假 设 题目 的 猜测 参数 越 高 则 其 时 间 强 度 参 数 和 视觉 
强度 参数 越 小 。 此 外 ， 题 目 时 间 精 度 参数 和 视觉 离散 程度 参数 分 别 从 均匀 分 布 和 逆 Gamma 分 布 生成 : 
6; ~ U(1.25,2) 和 hi~InvGamma(2, 6)。 男 外 ， 属 性 区 分 度 参数 被 固定 为 yx = 1.5， 属 性 难度 参数 被 固定 
为 yo = (71.5, -0.5, 0, 0.5, 1.3)”， 并 依据 公式 2 生成 被 试 的 属性 模式 。 

最 后 ,在 6 种 (2 样本 量 x2 测 验 长 度 x2 交叉 载 荷 ) 模 拟 测验 条 件 下 ,分 别 依据 C-MCDM-6、.C-MCDM-D 
和 C-MCDM-C 各 生成 30 组 平行 数据 (RA 数据 、RT 数据 和 FC 数据 )。 

在 每 种 模拟 测验 条 件 中 ， 使 用 数据 生成 模型 作为 分 析 模 型 。 对 于 每 组 数据 ， 三 个 分 析 模 型 均 使 用 
两 条 马尔 可 夫 链 (随机 起 点 )， 除 每 条 马尔 可 夫 链 长 减少 至 10,000 次 迭代 ( 预 热 5,000 次 )， 各 模型 的 参数 
估计 设 定 与 模拟 研究 中 保持 一 致 。 使 用 PSRF < 1.2 作为 参数 估计 收敛 指标 。 使 用 ppp 值 作为 模型 -数据 
绝对 拟 合 指 标 , 使 用 DIC 作为 模型 -数据 相对 拟 合 指标 ; 使 用 属性 判 准 率 ACCR = 225,2, 16e RR 
属性 模式 判 准 率 PCCR = DN Www 作为 潜在 属性 的 判 准 率 指标 ， 并 使 用 偏差 


bias() = DE, A> SITIO RMSE(S) = YEE 及 参数 估计 值 与 真 值 之 间 的 相关 系数 (Con 来 评 
估 其 他 参数 估计 的 返 真性 ， 式 中 R= 30 为 数据 组 数 。 


* * * * * * * * * * * * * * * 


| 
6 模拟 研究 Q 矩阵 民 x 刀 .空白 为 "0"”， 灰 色 为 "1”，* 表 示 T= 15 测验 条 件 下 用 题 . 


4.1.2 结果 

在 所 有 模拟 测验 条 件 下 ， 三 个 分 析 模 型 中 的 所 有 参数 的 PSRF 值 均 满 足 PSRF < 1.2 的 收敛 标准 (] 
98% 以 上 的 参数 满足 相对 更 严 苛 的 PSRF < 1.1 收敛 标准 (Brooks & Gelman, 1998)). 
图 7 分 别 呈 现 了 三 个 模型 的 属性 (模式 ) 判 准 率 。 首 先 ， 当 交叉 载荷 为 0 时 ， 三 个 模型 在 不 同 测验 条 
件 的 表现 基本 一 致 。 其 次 ， 随 着 交叉 载荷 的 提高 ， 可 发 现 三 个 模型 的 ACCR 和 PCCR 在 不 同 测验 条 件 
THAME. HP C-MCDM-C 提升 幅度 最 大 ，C-MCDM-D 次 之 ，C-MCDM-6 最 小 。 这 表明 ， 在 联 
合 -交叉 负载 建 模 法 中 , 为 提高 诊断 分 类 准确 性 , 直接 利用 RT 和 FC 数据 为 被 试 对 属性 的 掌握 情况 提供 
辅助 信息 比 先 为 高 阶 潜 在 能 力 提供 辅助 信息 再 间接 影响 被 试 对 属性 的 掌握 更 有 效 。 对 此 ， 一 种 可 能 的 
原因 是 ， 在 C-MCDM-6 中 ，HO-DINA 模型 (RA 数据 的 测量 模型 ) 中 的 高 阶 潜在 能 力作 为 一 种 辅助 参数 


加 


15 


202106.00029v3 


chinaXiv 


ChinaXiv 预 印 本 


其 参数 估计 返 


真性 通 


RT 和 FC 数据 中 的 辅助 信息 可 以 适当 提高 高 阶 潜在 能 力 的 参数 估计 准确 性 ， 


难以 有 效 促 进 潜在 属性 的 估计 准确 性 。 


图 8 分 别 


这 点 在 图 7 中 也 可 以 得 到 印证 


o 


呈现 了 三 个 模型 的 潜在 能 


常 较 差 (de la Torre & Douglas, 2004; Zhan, 2020; Zhan et al., 2020); 因此 ， 尽 管 利用 


、 潜 在 加 工 速度 和 潜在 视觉 参与 度 的 参数 估计 返 


但 或 许 是 提升 幅度 有 限 ， 


真性 。 首 


MT 


三 个 模型 在 所 有 条 件 的 参数 估计 偏差 都 接近 于 0 


0。 其 次 ， 对 C-MCDM-6 而 言 ， 随 着 交叉 载荷 的 提高 ， 


潜在 能 力 的 RMSE 逐渐 下 降 且 Cor 3 
的 估计 返 
提升 ， 但 潜在 加 工 速度 和 潜在 视觉 参 


逐渐 提高 ， 表 明 随 着 RT 和 FC 数据 中 的 辅助 信息 的 提高 , 潜在 能 力 


真性 会 随 之 增加 ; 但 值得 注意 的 是 ， 随 着 交叉 载荷 的 提高 ， 尽 管 潜在 能 力 的 估计 返 真 性 有 所 


与 度 的 估计 返 真性 却 出 现下 降 现 象 。 然 后 ， 对 C-MCDM-D 和 


C-MCDM-C 而 言 ， 
提高 ， 两 模型 
由 于 篇 幅 限制 ， 三 个 模型 的 题目 


于 RT 和 FC 数据 并 未 直接 为 潜在 能 力 提 供 辅 助 信息 系 
中 潜在 能 力 的 RMSE 略微 下 降 且 Cor 略微 提高 。 
参数 估计 返 


真性 呈现 在 附录 表 S2-S4 中 。 


; 因此 ， 随 着 交叉 载荷 的 


整体 而 言 ， 在 不 同 测验 


条 件 下 ， 三 个 模型 的 题目 参数 估计 返 真 性 都 较 好 ， 呈 现 出 较为 一 致 的 趋势 : 


被 试 数量 


增加 有 助 于 提 


题目 参数 估计 返 真 性 ， 而 测验 长 度 和 交叉 载荷 大 小 的 影 


(a) C-MLDM-0 


(b) C-MLDM-D 


响 似乎 很 小 。 


(c) C-MLDM-C 


€ dem. Se) eS cU ee ee gg ced dw eom cq Oe ae | Se |) EX coe ME ex ce | 
TTTTTYYTITTTYSTITIT TTTTTTYTYTTTTITIT TTTTTYTITTITITITIT 
J a Ala A AlS A Aln A A d Hduüdndnudnudnudiu0nuinu0su = S Ala A AIA A AAAA 
5 59 uja è 0/5 o DJD 6 GB 5 o 5/6 6 0/5 o 5/5 6 各 5 59 ajo a 0/50 o 6/5 6 D 
15 1-30 15 30 I-15 I-30 I-15 30 15 1-30 15 30 
N-100 N-500 N-100 N-500 N-100 N-500 
EH ACCR Al B ACCR. A2 B ACCR_A3 NE ACCR A1 NH ACCR. A2 B ACCR A3 EE ACCR Al NH ACCR. A2 B ACCR A3 
mmm ACCR_A4 ml ACCR_AS —- PCCR mm ACCR_A4 Ba ACCR_AS —- PCCR mmm ACCR_A4 Bl ACCR_AS —- PCCR 
"m = = j e Mey] yp zz 
图 7 模拟 研究 1 中 三 个 C-MCDM 的 属性 (模式 ) 判 准 率 . 
xx v E 3 m wn e M Mab ye see ES Mk ki b xal ye sz 
注 : N= 样本 量 ;I= 测验 长 度 ; CL = 交叉 载荷 ;ACCR = 属性 判 准 率 ; PCCR = 属性 模式 判 准 率 . 
(a) C-MLDM-0 (b) C-MLDM-D (c) C-MLDM-C 
10 , " Ea Eg Ha lÜ ., 9 e * © * s @ s * * 8 lÜ-—&—. à * 9 * s» s. $y * * V* 
LI 
08 —À CONUS ss 8 a ee ee ës 08... E toot 
. ® — — 一 一 
M . SR SN j e c — = 0.6 SSS 
0.4 0.4 0.4 
02 m. 一 一 — 02 02 oe 
00 —- -— -- —- — - - -一 一 0.0 ~-— - - 0.0 ~ - 一 一 
-0.2 -0.2 -0.2 
eanecqganeqganegqga eaneoqganegaxneqga&« ane qne «0-02 «4 ^4 
TTTTTTTTTIT'T1TIT TTTTTITYTYTITYTYT7TIT TTTTTTITTTTZTIT 
Ana a eda A nA A A vn A A RD Ana a eda A nd A A DA A vA A 站 只 用 | 中 中 中 | 中 只 中 | 用 日 
6 6 0/5 o 5/5 o Ujo Do ooococoococoocoo0oQ€ 6 6 0/5 0 Ge 6 BIG U O 
E15 I-30 I-15 30 E15 I-30 15 30 15 1-30 I-15 30 
N-100 N-500 N-100 N-500 N-100 N-500 
EE 0 Bias mu t Bias EH c Bias EE 0 Bias mw c Bias EH c Bias EE 0 Bias mW t Bias EH c Bias 
0 RMSI ERMSE 0 RMSE t RMSE e RMSE 0 RMS! 1t RMSE e RMSE 
* 0Cor * tCor * &Cor * 0Cor * cv Cor * &Cor * 0Cor * tCor * &Cor 
d = 3 ae p 
图 8 模拟 研究 1 中 三 个 C-MCDM 的 潜在 能 力 、 潜 在 加 工 速度 和 潜在 视觉 参与 度 的 参数 估计 返 真性 . 


注 :N= 样本 量 ;I= 测验 长 度 ; CL = 交叉 载荷 ; 
Cor = 估计 值 与 真 值 的 相关 系数 . 
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= 高 阶 潜在 能 力 ; t= 潜在 加 工 速度 ; e= 潜在 视觉 


参与 度 ; Bias = 偏差 ; RMSE = 均 方 根 误差 ; 
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4.2 模拟 研究 2 
4.2.1 数据 生成 与 分 析 

为 进一步 探究 新 模型 的 相对 优势 及 交叉 -负载 的 必要 性 ， 模 拟 研 究 2 中 分 别 使 用 三 个 新 模型 和 
H-MCDM 作为 数据 生成 模型 ， 然 后 对 比 探究 几 个 模型 的 表现 。 当 三 个 新 模型 作为 数据 生成 模型 时 ， 被 
试 的 潜在 能 力 、 江 在 加 工 速度 和 潜在 视觉 参与 度 的 生成 方法 与 模拟 研究 1 保持 一 致 (公式 12); 交叉 载 
荷 CL Qu 7 -由 从 均值 为 0.1、 标 准 差 为 0.3 的 正 态 分 布 中 抽取 ， 表 明 交 叉 载 荷 在 题目 之 间 存 在 差异 (该 
设 定 参考 了 上 文 实证 数据 的 结果 )。 当 H-MCDM 作为 数据 生成 模型 时 ， 被 试 的 潜在 能 力 、 洪 在 加 工 速 
度 和 潜在 视觉 参与 度 按 如 下 分 布 生 成 : 


0, 0 1 
t,|-MVN||0||-025 025 
6, oj | 0.25 -0.125 025 


(14) 
WEES, por ——0.5. pe = 0.5 flip = -0.5， 该 设 定 参考 了 已 有 实证 数据 的 结果 (Zhan et al., 2018; Man & 
Harring, 2019): 假设 学 生 能 力 越 高 则 加 工 速 度 越 慢 且 视 觉 参 与 度 水 平 越 高 ， 同 时 ， 学 生 学 习 能 力 越 低 
则 加 工 速 度 越 快 且 视 觉 参 与 度 水 平 越 低 。 另 外 ， 每 种 模拟 条 件 下 均 固定 被 试 量 N= 500 和 测验 长 度 了 = 
30， 其 他 设 定 均 与 模拟 研究 1 保持 一 致 。 每 种 模拟 条 件 下 生成 30 组 数据 。 

当 三 个 新 模型 作为 数据 生成 模型 时 ， 仅 使 用 数据 生成 模型 和 H-MCDM 分 析 数 据 ; 当 H-MCDM fF 
为 数据 生成 模型 时 ， 使 用 H-MCDM 和 三 个 新 模型 分 析 数 据 。 参 数 估 计 设 定 (如 ， 链 数 和 链 长 等 )、 收 敛 
指标 和 返 真 性 指标 等 均 与 模拟 研究 1 保持 一 致 。 
4.2.2 结果 

dé 6 呈现 不 同 条 件 下 各 数据 分 析 模 型 与 数据 的 拟 合 情 况 。 首 先 ， 无 论 何 种 条 件 下 ， 数 据 生 成 模型 
本 身 对 模拟 数据 的 拟 合 均 相 对 更 好 。 其 次 ， 根 据 DIC 可 发 现 ， 当 C-MCDM 作为 数据 生成 模型 时 ， 
C-MCDM 较 H-MCDM 的 相对 优势 较 大 ; 而 当 H-MCDM 作为 数据 生成 模式 时 , H-MCDM 较 C-MCDM 
的 相对 劣势 较 小 ; 表明 C-MCDM 对 不 同 测验 条 件 的 兼容 性 比 H-MCDM 更 好 。 即 忽略 可 能 存在 的 交叉 
负载 所 导致 的 模型 -数据 不 拟 合 比 元 余 考 虑 存在 交叉 负载 所 导致 的 模型 -数据 不 拟 合 的 程度 更 大 。 表 7 E 
现 了 不 同 条 件 下 各 数据 分 析 模 型 的 属性 判 准 率 。 结 果 的 整体 趋势 与 DIC 的 类 似 ， 即 忽略 可 能 存在 的 交 
XARA PCCR 的 负面 影响 比 元 余 考 虑 存在 交叉 负载 对 PCCR 的 负面 影响 更 大 。 另 外 ， 潜 变量 的 和 题 
目 参 数 的 返 真 性 也 均 呈 现 类 似 的 趋势 ( 见 附录 表 S5-S6)。 总 之 ， 模 拟 研究 2 结果 表明 忽略 可 能 存在 的 交 
又 负载 所 导致 的 负面 结果 比 元 余 考 虑 存在 交叉 负载 所 导致 的 更 严重 , 即 C-MCDM 对 测验 情境 的 兼容 性 
优 于 H-MCDM 的 。 


表 6 模拟 研究 2 中 模型 -数据 拟 合 情 况 . 
数据 生成 模型 数据 分 析 模 型 DIC 
C-MCDM-0 H-MCDM 186481.5 
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C-MCDM-8 181029.5 

C-MCDM-D H-MCDM 183774.8 

C-MCDM-D 181720.3 

C-MCDM-C H-MCDM 189775.6 

C-MCDM-C 183881.5 

H-MCDM H-MCDM 180286.2 

C-MCDM-0 180395.0 

C-MCDM-D 180347.8 

C-MCDM-C 180351.9 

3e 7 模拟 研究 2 中 潜在 属性 (模式 ) 判 准 率 . 
ACCR 
Mz AE ». 黄 型 M 人 黄 刑 

数据 生成 模 数据 分 析 模 25 FC "T nt PCCR 
C-MCDM-8 H-MCDM 0.957 0.966 0.967 0.975 0.977 0.862 
C-MCDM-0 0.961 0.969 0.969 0.977 0.979 0.874 
C-MCDM-D H-MCDM 0.953 0.966 0.966 0.971 0.982 0.860 
C-MCDM-D 0.960 0.970 0.984 0.980 0.987 0.894 
C-MCDM-C H-MCDM 0.955 0.961 0.969 0.970 0.980 0.858 
C-MCDM-C 0.99] 0.990 0.988 0.990 0.995 0.958 
H-MCDM H-MCDM 0.960 0.958 0.967 0.977 0.977 0.863 
C-MCDM-80 0.960 0.957 0.967 0.977 0.977 0.863 
C-MCDM-D 0.957 0.958 0.967 0.977 0.976 0.861 
C-MCDM-C 0.957 0.957 0.966 0.976 0.976 0.859 


5 总 结 与 展望 


5.1 总 结 


个 体 的 问题 解决 行为 是 彼此 相关 的 多 
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， 通 过 多 种 仪器 或 测量 设备 采集 的 多 模 态 数据 为 实现 对 个 体 认 知 结构 的 精准 诊 
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响 RT 和 FC， 而 后 者 认为 被 试 掌握 该 题目 所 考查 的 属性 
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E( 如 , 认 知 风格 ) 的 推断 。 最 后 


响 RT 和 FC。 然 后 ， 
传统 分 离 建 模 法 的 S-MCDM、 基 
究 结 果 表 明 (1) 联 合 分 析 ( 即 
F 提 供 平行 信息 的 多 模 态 数据 ; 且 (2) 从 模型 - 
E 研 究 也 向 读者 展示 了 如 何 
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进一步 探讨 新 模型 的 表现 。 模 拟 研 究 1 作为 对 实证 研究 的 补充 ， 探 究 了 三 个 新 模型 在 不 同 模拟 测验 条 
件 的 参数 估计 返 真性 。 模 拟 研 究 2 对 比 探讨 了 三 个 新 模型 和 H-MCDM 的 表现 ， 以 展示 新 模型 的 相对 优 
势 及 考虑 交叉 负载 的 必要 性 。 模 拟 研 究 1 结果 表明 (1) 全 贝 叶 斯 MCMC 算法 能 够 为 三 个 新 模型 提供 较 好 
的 参数 估计 返 真 性 ， 且 三 个 新 模型 中 各 参数 估计 均 可 有 效 收 敛 ;， (2) 实 践 应 用 中 ， 充 足 的 题目 数量 是 保 
证 被 试 参数 估计 准确 性 的 必要 条 件 之 一 ; (3) 在 不 以 题库 建设 为 目标 的 (或 其 他 题目 参数 相对 不 重要 的 ) 
应 用 场景 中 , 100 人 的 小 样本 量 足 以 满足 提供 较为 精准 的 被 试 参数 估计 值 。 模拟 研究 2 结果 表明 忽略 可 
能 存在 的 交叉 负载 所 导致 的 负面 结果 比 元 余 考 虑 存在 交叉 负载 所 导致 的 更 严重 , 即 C-MCDM 对 测验 情 
境 的 兼容 性 优 于 H-MCDM 的 。 总 之 ， 本 文通 过 实证 研究 阐明 了 新 模型 的 现实 可 应 用 性 ， 并 通过 模拟 研 
究 阅 明了 新 模型 具有 良好 的 心理 计量 学 性 能 。 

综 上 所 述 ， 对 本 文 的 理论 创新 、 理 论 贡 献 和 应 用 价值 做 如 下 总 结 : 

(1) 理 论 创新 : 首次 将 联合 -交叉 负载 建 模 法 引入 认 知 诊断 领域 ， 提 出 三 种 不 同 假设 的 C-MCDM ; 

(2) 理 论 贡献 : 填补 了 在 认 知 诊断 领域 缺少 联合 -交叉 负载 模型 的 空白 ; 

(3) 应 用 价值 ， 从 全 面 反馈 视角 出 发 ， 以 认 知 风格 和 认 知 流畅 性 为 例 ， 尝 试 在 认 知 诊断 中 提供 认 知 
结构 以 外 其 他 认 知 特征 的 反馈 ; 丰富 了 认 知 诊断 反馈 的 范围 ， 增 加 了 认 知 诊断 的 实践 价值 。 

另外 ， 本 文 遵循 Zhan 等 (2021) 的 做 法 ， 将 实验 心理 学 与 心理 与 教育 测量 相 结合 ， 尝 试 将 眼 动 数据 
引入 心理 计量 模型 ， 这 在 一 定 程度 上 拓展 了 心理 与 教育 测量 的 研究 范式 ， 为 今后 进一步 将 实验 心理 学 
基于 仪器 的 测量 或 量化 研究 方法 引入 传统 心理 与 教育 测量 中 提供 了 新 视角 。 
值得 强调 的 是 由 于 新 提出 的 三 个 C-MCDM 与 H-MCDM 是 基于 不 同 联合 建 模 方法 构建 的 ， 即 它们 
基于 不 同 的 理论 假设 。 在 本 文中 ， 尽 管 三 个 C-MCDM 对 实证 数据 的 拟 合 程度 优 于 HMCDM， 这 并 不 
代表 它们 三 者 在 任何 测验 情境 下 都 优 于 H-MCDM; 比如 ，H-MCDM 的 相对 优势 是 理论 结构 简单 、 待 
汕 计 参数 数量 较 少 。 因 此 ， 本 文 更 多 的 是 在 认 知 诊断 领域 向 读者 提供 一 种 基于 联合 -交叉 负载 建 模 法 的 
多 模 态 数据 分 析 视 角 和 方法 ， 以 期 进一步 丰富 多 模 态 诊断 数据 分 析 模 型 的 可 选项 。 我 们 建议 后 续 使 用 
者 针对 特定 的 实证 数据 ， 同 时 使 用 多 个 MCDM 对 数据 进行 联合 分 析 ， 并 基于 数据 -模型 拟 合 指标 来 选 
择 相对 最 合适 的 模型 ， 并 结合 模型 的 构建 理论 对 分 析 结 果 做 进一步 解读 。 
5.2 局 限 与 展望 

本 文 仍 有 一 些 局 限 性 ， 值 得 后 续 做 进一步 探究 。 第 一 ， 与 已 有 联合 分 析 RA 数据 和 RT 数据 的 研究 
相 比 ， 尽 管 本 文 仅 额 外 分 析 了 一 种 眼 动 数据 一 一 注视 点 数 (FC), 但 鉴于 联合 -层级 建 模 法 和 联合 -交叉 负 
载 建 模 法 的 灵活 扩展 性 , 其 他 类 型 的 眼 动 数据 或 其 他 模 态 数据 (如 ， 脑 电 [Jeon et al., 2021]) 也 可 尝试 被 纳 
入 分 析 中 ， 进 而 提出 更 全 面 的 可 联合 分 析 更 多 模 态 数据 的 认 知 诊断 模型 。 
第 二 ， 本 文 以 三 个 代表 性 的 测量 模型 ( 即 HO-DINA 模型 、LRT 模型 和 NBF 模型 ) 为 例 阐述 了 联合 - 
又 负 载 认 知 诊断 模型 的 构建 。 同 样 ， 鉴 于 联合 -交叉 负载 建 模 法 的 灵活 扩展 性 ， 后 续 针 对 不 同 的 测验 
境 可 分 别 蔡 换 不 同 的 测量 模型 。 当然, 需要 强调 的 是 测量 模型 的 更 换 并 不 影响 本 文 的 主要 创新 点 一 一 
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联合 -交叉 负载 认 知 诊断 建 模 法 。 
B=, WIE Zhan 等 (2021)， 利 用 多 模 态 诊断 数据 本 文 只 关注 到 对 有 限 认 知 特征 的 推断 ， 如 沉思 型 - 
冲动 型 认 知 风格 、 聚 焦 者 认 知 风格 和 认 知 流畅 性 。 实 际 上 ， 个 体 的 认 知 特征 还 有 很 多 ， 仅 认 知 风格 就 
还 有 其 他 的 分 类 方式 ， 比 如 场 独立 性 - 场 依存 性 、 言 语 型 -视觉 型 等 ， 从 全 面 反馈 的 视角 看 ， 未 来 是 否 有 
用 多 模 态 的 数据 实现 对 更 多 认 知 特征 的 推断 ， 甚 至 对 是 一 些 非 认 知 因素 (如 , 动机、 情绪 和 信念 ) 
的 识别 ， 是 非常 值得 关注 的 研究 方向 。 
第 四 ， 本 文 主要 是 提供 了 一 种 多 模 态 诊断 数据 的 分 析 方 法 ， 实 际 上 ， 对 多 模 态 数据 的 利用 可 以 延 
伸 到 很 多 已 有 模型 中 。 比 如 ， 后 续 研 究 可 以 将 多 模 态 数据 引入 多 策略 CDM (Ma & Guo, 2019)、 多 水 平 
CDM (Wang & Qiu, 2018) 和 多 级 评分 CDM (Ma & de la Torre, 2016) 中 , 甚至 考虑 将 多 模 态 数据 引入 到 一 
些 非 参数 诊断 法 中 (如 ， 聚 类 分 析 ) 等 。 

第 五 ， 本 文 提 出 的 三 个 C-MCDM 均 未 考虑 潜在 加 工 速度 和 潜在 视觉 参与 度 对 RA 的 影响 ， 即 未 考 
虑 利用 RA 数据 信息 提高 这 两 个 潜在 变量 的 参数 估计 精度 。 后 续 ， 若 有 必要 也 可 尝试 C-MCDM 做 进 
步 拓 广 ， 纳 入 上 述 未 考虑 的 路 径 ( 郑 天 鹏 等 ,in press)， 开 发 全 交叉 负载 模型 ， 只 不 过 要 额外 注意 模型 可 
识别 性 问题 。 

ee 第 六 ， 如 2.3.4 节 中 所 述 ， 由 于 在 RT 和 FC 测量 模型 中 的 被 试 参数 为 连续 变量 ， 无 法 像 对 潜在 属 
= 性 的 诊断 一 样 直接 对 个 体 的 潜在 加 工 速度 和 潜在 视觉 参与 度 进行 分 类 ， 进 而 无 法 直接 实现 对 个 体 认 知 


CC 
= 


Cl 
O 特征 的 分 类 。 对 此 ， 本 文采 用 了 以 均值 为 切 点 的 分 类 方法 ， 并 依据 潜在 能 力 、 洪 在 加 工 速度 和 潜在 视 
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用 于 对 个 体 认 知 特征 的 粗略 推断 ， 并非 精确 的 测量 或 诊断 结果 ; (2) 这 种 分 类 方法 所 利用 的 信息 尚 有 限 ， 
仅 利 用 了 潜在 能 力 、 潜 在 加 工 速度 和 潜在 视觉 参与 度 这 三 个 潜在 变量 的 估计 值 作 分 类 依据 。 未 来 ， 为 
实现 对 个 体 认 知 特征 的 更 精准 推断 甚至 是 测量 ， 可 尝试 从 三 个 角度 突破 : (1) 综 合 利 用 更 多 模 态 的 数据 
来 实现 对 个 体 认 知 特征 的 推断 ， 以 期 为 推断 性 分 类 提供 更 多 的 参考 信息 (2) 尝试 借鉴 计算 机 化 分 类 测 
验 中 对 连续 变量 的 分 类 方法 (Ferguson, 1969)， 以 期 改进 以 均值 为 切 点 的 分 类 方法 (2) 直接 通过 类 别 变 
量 构建 特定 认 知 特征 的 被 试 参数 (Wang & Chen, 2020)， 以 期 实现 对 个 体 认 知 特征 的 测量 而 非 推断 。 
第 七 ， 由 于 现实 硬件 条 件 的 限制 (如 , 没有 大 批量 眼 动 仪 )， 本 文 所 分 析 的 实证 数据 仍 属于 小 规模 测 
验 ( 由 于 成 本 仪器 成 本 原因 , 在 未 来 一 段 时 间 , 涉及 实验 仪器 采集 数据 的 研究 都 会 受 限 于 被 试 量 的 问题 )。 
尽管 模拟 研究 结果 现实 ， 在 不 考虑 建立 题库 的 应 用 场景 下 小 样本 量 (100 人 ) 也 可 以 满足 要 求 ， 但 在 大 规 
模 测验 和 涉及 题库 的 应 用 场景 (如 ， 计算机 化 自 适 应 测验 ) 中 ， 这 些 硬件 条 件 的 限制 都 会 制约 多 模 态 数据 
分 析 方 法 的 实际 应 用 。 随 着 测量 方式 及 数据 分 析 技 术 的 不 断 发 展 ， 充 分 利用 计算 机 (网 络 ) 技 术 ， 尤 其 是 
人 工 智 能 的 介入 ， 并 结合 便携 式 和 低 成 本 的 心理 学 实验 仪器 ， 我 们 期 待 也 有 理由 相信 未 来 可 以 突破 硬 
件 条 件 的 限制 ， 在 大 规模 测验 中 实现 对 多 模 态 数据 的 采集 与 分 析 。 

最 后 ， 在 贝 叶 斯 参数 估计 值 中 ， 先 验 分 布 的 选择 反映 了 数据 分 析 者 对 模型 参数 的 信念 或 已 有 经 验 。 
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根据 已 有 数据 分 析 经 验 以 及 已 有 研究 结果 (Man & Harring, 2019; Zhan et al., 2021), 本 文选 取 了 特定 的 先 
验 分 布 。 尽 管 鲁 棒 性 分 析 表 明 模 型 的 参数 估计 结果 受 包含 不 同 信息 量 的 先 验 分 布 的 影响 较 小 ， 但 这 3 
不 意味 着 本 文 所 用 的 先 验 分 布 适 用 于 所 有 测验 情境 。 在 后 续 的 实践 应 用 中 ， 和 针对 全 新 的 实证 数据 ， 数 
据 分 析 者 也 可 尝试 使 用 超 先 验 分 布 来 探索 恰当 的 先 验 分 布 。 
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Abstract 

Students' observed behavior (e.g., learning behavior and problem-solving behavior) comprises of 
activities that represent complicated cognitive processes and latent conceptions that are frequently 
systematically related to one another. Cognitive characteristics such as cognitive styles and fluency may differ 
between students with the same cognitive/knowledge structure. However, practically all cognitive diagnosis 
models (CDMs) that merely assess item response accuracy (RA) data are currently incapable of estimating or 
inferring individual differences in cognitive traits. With advances in technology-enhanced assessments, it is 
now possible to capture multimodal data, such as outcome data (e.g., response accuracy), process data (e.g., 
response times (RTs), and biometric data (e.g. visual fixation. counts (FCs)) automatically and 
simultaneously during the problem-solving activity. Multimodal data allows for precise cognitive structure 
diagnosis as well as comprehensive feedback on various cognitive characteristics. 

First, using joint analysis of RA, RT, and FC data as an example, this study elaborated three multimodal 
data analysis methods and models, including separate modeling (whose model is denoted as S-MCDM), 
joint-hierarchical modeling (whose model is denoted as H-MCDM) (Zhan et al, 2021) and 
joint-cross-loading modeling (whose model is denoted as C-MCDM ). Following that, three C-MCDMs with 
distinct hypotheses were presented based on joint-cross-loading modeling, namely, the C-MCDM-0, 
C-MCDM-D, and C-MCDM-C, respectively. Three C-MCDMs, in comparison to the H-MCDM, introduce 
two item-level weight parameters (i.e., pi and à;) into the RT and FC measurement models, respectively, to 
quantify the impact of latent ability or latent attributes on RT and FC. The Markov Chain Monte Carlo method 
was used to estimate model parameters using a full Bayesian approach. To illustrate the three proposed 
models' application and compare them to the S-MCDM and H-MCDM, multimodal data for a real-world 
mathematics test was used. Data was gathered at a prominent university on the East Coast of the United States 
in an eye-tracking lab. An Z = 10 mathematics items test was given to N = 93 university students with normal 
or corrected vision. The test included K = 4 attributes, and the related Q-matrix is shown in Figure 3. The data 
is divided into three modalities: RA, RT, and FC, which were all collected at the same time. The data was 
fitted to all five multimodal models. 

In addition, two simulation studies were conducted further to explore the psychometric performance of 


the proposed models. The purpose of simulation study 1 was to explore whether the parameter estimates of the 
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proposed models can converge effectively and explore the recovery of parameter estimation under different 
simulated test situations. The purpose of simulation study 2 was to explore the relative merits of C-MCDMs 
and H-MCDM, that is, to explore the necessity of considering cross-loading in multimodal data analysis. 

The results of the empirical study showed that (1) the C-MCDM-0 has the best model-data fitting, 
followed by the H-MCDM and the S-MCDM. Although the DIC showed that the C-MCDM-D and 
C-MCDM-C also fitted the data well, the results were only for reference because some parameter estimates in 
these two models did not converge; that (2) the correlation coefficients between latent ability and latent 
processing speed and that between latent ability and latent concentration were weak, making it difficult to 
fully exploit the theoretical advantages of H-MCDM over S-MCDM (Ranger, 2013). By contrast, since the 
C-MCDM-O can directly utilize the information from RT and FC data, the standard error of the estimates of its 
latent ability was significantly lower than that of the previous two competing models; and that (3) the median 
of the estimates of ọ; was less than 0, which indicated that for most items, the higher the participant’s latent 
ability is, the longer the time it will take to solve the items; and the median of the estimates of 入 was higher 
than 0, which indicated that for most items, the higher the participants latent ability is, the more number of 
fixation counts he/she shown in problem-solving. Furthermore, it should be noted that the estimates of pi and 
À; do not always have the same sign for different items, indicating that the influence of latent abilities on RT 
and FC has different directions (i.e., facilitation or inhibition) for different items. Furthermore, simulation 
study 1 indicated that the parameter estimation of the proposed three models could converge effectively and 
the recovery of model parameters was good under different simulated test situations. The results of simulation 
study 2 indicated that the adverse effects of ignoring the possible cross-loadings are more severe than 
redundantly considering the cross-loadings. 

Overall, the results of this study indicate that (1) fusion analysis is more suitable for multimodal data that 
provides parallel information than separate analysis; that (2) through cross-loading, the proposed models can 
directly use information from RT and FC data to improve the parameter estimation accuracy of latent ability 
or latent attributes; that (3) the results of the proposed models can be used to diagnose cognitive structure and 
infer other cognitive characteristics such as cognitive styles and fluency; and that (4) the proposed models 
have better compatibility with different test situations than H-MCDM. 

Keywords cognitive diagnosis, multimodal data, item response times, fixation counts, cognitive style, 


eye-tracking 
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在 线 附 录 : 
引入 眼 动 注视 点 的 联合 -交叉 负载 多 模 态 认 知 诊断 建 模 


S1 参数 估计 对 先 验 分 布 的 鲁 棒 性 分 析 
S1.1 高 、 中 和 低 信息 先 验 分 布 
S1.1.1 中 信息 先 验 分 布 
在 贝 叶 斯 参数 估计 值 中 ， 先 验 分 布 的 选择 反映 了 数据 分 析 者 对 模型 参数 的 信念 或 已 有 经 验 。 根 据 
已 有 数据 分 析 经 验 以 及 已 有 研究 结果 (如 , Man & Harring, 2019; Zhan et al., 2021)， 包 含 适 量 信息 的 先 验 
分 布 ( 即 中 信息 先 验 分 布 ) 设 定 如 下 (对 三 个 C-MCDM 通用 ): 

首先 ， 根 据 局 部 独立 性 假设 ， 有 


Y,, ~ Bernoulli( P(Y,, =1)), 
log(T,,) ~ N(, - t,» 
V ~ NB(exp(e, +m,), d;^), 
a.,, ~ Bernoulli( P(a,, — 1)). 


o; ), 


其 次 ， 对 题目 参数 而 言 ， 有 


s, ~ Beta(1, 1), g; ~ Beta(1,1) (g; «1— s;), 
E, ~ N(4, 2), œ, ~ 4[InvGamma(I, 1), 

m, ~ N(4, 2), h, ~ InvGamma(], 1), 

, ~ N(0,0.5),A, ~ N(0, 0.5). 


然后 ， 对 被 试 参数 而 言 ， 有 


9, ~ N(0,1), 


T, 0 
~ MVN TA os h 
£, 0 
1 0 
2 ~ InvWishart J 2 |. 
person 0 1 


和 有， 对 高 阶 潜在 结构 参数 而 言 ， 有 
y, ~ N(0,2), y, ~ N(1.5,2) Ky, > 0) 


S1.1.2 低 信 息 先 验 分 布 
低 信息 先 验 分 布 的 设 定 以 “无 知 ” 为 前 提 ， 并 以 大 方差 (如 , 10) 为 变异 范围 。 在 S1.1.1 的 基础 上 ， 低 
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信息 先 验 分 布设 定 如 下 : 
s; ~ Betall, 1), g, ~ Betall,1)I(g, «1— s;), 
E, ~ N(0,10)IG > 0), o, ~ JInvGamma(1, 10), 
m, ~ N(0,10) I(m, > 0), h, ~ InvGamma(1, 10), 
9, ~ N(0,10),A, ~ N(0, 10), 
y, ~ N(0,10), y, ~ N(0, 10) I(y, > 0). 


其 他 参数 的 先 验 分 布 保持 不 变 。 
S1.1.3 高 信息 先 验 分 布 
高 信息 先 验 分 布 的 设 定 以 “先知 ”为 前 提 ， 围 绕 参 数 “ 真 值 ”进行 ， 并 以 小 方差 (如 , 0.5) 为 变异 范围 。 
在 S1.1.1 的 基础 上 ， 高 信息 先 验 分 布设 定 如 下 : 
s, ~ Beta(1,10), g, ~ Beta(1,10) I(g, <1—s,), 
E, ^ N(4,0.5), @, ~ QU(1.5, 4), 
m, ~ N(4, 0.5), h, ~ InvGamma(2, 6), 
0, ~ N(—0.5,0.5), A, ~ N(0.5, 0.5), 
y, ~ N(0,1), y, ~ NC.5, 0.1) ICy, > 0). 


其 他 参数 的 先 验 分 布 保持 不 变 。 


S1.2 参数 估计 一 致 性 
选用 正文 模拟 研究 中 N= 100,7=15, CL =0.5 条 件 下 生成 的 数据 作为 分 析 数 据 ; 该 模拟 测验 条 件 属 
于 小 样本 短 测验 情境 ， 理 论 上 ， 参 数 估计 结果 受到 先 验 分 布 的 影响 更 大 。 因 此 ， 随 样本 量 增 大 及 测验 
长 度 提高 ,参数 估计 结果 受 先 验 分 布 中 所 含 信息 量 的 影响 会 逐渐 降低 ( 即 鲁 棒 性 会 增加 )。 三 个 模型 的 参 
数 估计 设 定 ( 如 ,马尔 可 夫 链 长 ) 与 模拟 研究 中 保持 一 致 。 
图 S1-S2 和 表 S1 分 别 呈现 了 三 个 模型 在 不 同 信息 量 先 验 分 布下 各 参数 的 返 真性 。 可 发 现 随 着 先 验 
分 布 的 信息 量 的 提高 ， 各 参数 的 返 真 性 均 有 小 幅度 提升 ， 其 中 ， 提 升幅 度 相 对 较 大 的 是 由 低 信 息 量 
验 到 中 信息 量 先 验 时 ， 而 由 中 信息 量 先 验 到 高 信息 量 先 验 的 提升 幅度 微弱 。 考 虑 到 实际 应 用 中 很 少 使 
用 如 此 低 信息 的 先 验 分 布 且 无 法 像 高 信息 先 验 分 布 那样 围绕 各 参数 的 “ 真 值 ?进行 设 定 ， 中 信息 先 验 分 
布 的 普 适 性 是 相对 较 高 的 : 即 避 免 了 不 实际 的 “无 知 ?或 “先知 ”， 同 时 又 保证 了 较 高 的 参数 估计 精度 。 因 
此 ， 正 文中 我 们 选用 中 信息 先 验 分 布 进行 后 续 的 分 析 。 
整体 而 言 ， 当 采用 包含 不 同 信息 量 的 先 验 分 布 时 ， 每 个 模型 的 参数 估计 结果 均 较为 稳定 ， 即 新 模 
型 对 不 同 先 验 分 布 具 有 一 定 的 鲁 棒 性 。 
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低 中 高 R 


C-MLDM-9 C- 


mm ACCR AI WM ACCR_A2 Mili ACCR_A3 
fm ACCR A4 BM ACCR_A5 -*- PCCR 


中 高 KO 中 高 
MLDM-D C-MLDM-C 


图 S1 三 模型 在 不 同 信息 量 先 验 分 布下 的 属性 (模式 ) 判 准 率 . 


0.8 n 8 


06 一 一 


0.2 
" PCR EDT 
-0.[2 
低 中 高 低 中 高 d& 中 高 
C-MLDM-8 C-MLDM-D C-MLDM-C 

EN 0 Bias E + Bias El c Bias 

—— 0RMSE | — t RMSE £ RMSE 

* 6Cor e cv Cor * gCor 


注 : N= 样本 量 ;I= 测验 长 度 ; CL = 交叉 载荷 ;ACCR = 属性 判 准 率 ; PCCR = 属性 模式 判 准 率 . 


S2 三 模型 在 不 同 信息 量 先 验 分 布下 的 潜在 


能 力 、 潜 在 加 工 速 度 和 潜在 视觉 参与 度 的 返 真性 . 


Cor = 估计 值 与 真 值 的 相关 系数 . 


VEN = 样本 量 ; T= 测验 长 度 ; CL = 交叉 载荷 ; 9= 高 阶 潜在 能 力 ; t= 潜在 加 工 速度 ; s = 潜在 视觉 参与 度 ; Bias = 偏差 ;RMSE = 均 方 根 误差 ; 
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d S1 三 模型 在 不 同 信 息 量 先 验 分 布下 的 题目 参数 返 真 性 . 
am BRIN g s C 四 m d 9 À 

E 信息 量 Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor Bias RMSE Bias RMSE 
C-MCDM-9 氏 0.016 0.051 0.875 0.055 0.086 0.952 -0.063 0.088 0.993 -0.332 0.355 0.878 -0.067 0.095 0.992 0.001 0.004 0.985 -0.042 0.112 0.049 0.134 
0.014 0.050 0.875 0.056 0.086 0.952 0.002 0.062 0.993 —0.015 0.121 0.869 0.000 0.067 0.992 0.000 0.004 0.985 0.152 0.182 —0.148 0.188 
高 -0.010 0.046 0.882 —0.022 0.078 0.954 —0.002 0.061 0.993 0.003 0.100 0.890 0.003 0.065 0.992 0.000 0.003 0.985 —0.023 0.100 0.026 0.108 
C-MCDM-D 低 0.021 0.049 0.914 0.084 0.127 0.930 -0.113 0.257 0.913 -0.233 0.258 0.822 -0.123 0.227 0.912 0.000 0.003 0.982 -0.066 0.218 0.085 0.195 
中 0.014 0.045 0.923 0.033 0.069 0.959 0.005 0.086 0.986 -0.013 0.124 0.825 0.009 0.073 0.989 0.000 0.003 0.982 0.029 0.152 -0.023 0.132 
高 -0.007 0.041 0.930 -0.028 0.080 0.956 -0.004 0.085 0.986 0.013 0.116 0.826 0.003 0.072 0.989 0.000 0.003 0.982 -0.012 0.150 0.006 0.129 
氏 0.009 0.041 0.928 0.042 0.080 0.941 —0.036 0.122 0.977 -0.334 0.356 0.869 —0.066 0.166 0.952 0.001 0.003 0.987 0.001 0.096 0.018 0.128 
中 0.009 0.040 0.929 0.035 0.073 0.947 0.009 0.106 0.981 -0.021 0.121 0.864 -0.001 0.100 0.981 0.000 0.003 0.987 0.014 0.096 -0.012 0.092 
—0.009 0.040 0.931 -0.024 0.073 0.949 -0.003 0.103 0.981 0.004 0.103 0.874 -0.011 0.098 0.981 0.000 0.003 0.987 —0.006 0.095 0.004 0.091 
iE: g = 猜测 参数 ; s = 失误 参数 ;5= 时 间 强 度 参 数 ; wm = 时 间 精 度 参数 ; m = 视觉 强度 参数 ;dg= 视觉 区 分 度 参数 ; 9 = 作答 时 间 上 的 交叉 载荷 ; 
= 注视 点 上 的 交叉 载荷 . 
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表 S2 模拟 研究 1 中 C-MCDM-9 模 型 的 题目 参 交 
g S 6 @ m d 0) 入 
Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor Bias RMSE Bias RMSE 


» 
E 
Bi 
AL 
BE 


N I CL 


100 15 0.0 0.013 0.054 0.852 0.047 0.080 0.950 —0.001 0.066 0.992 -0.010 0.118 0.868 0.001 0.058 0.993 0.000 0.004 0.987 0.003 0.104 0.012 0.106 

0.2 0.016 0.050 0.894 0.046 0.084 0.937 0.002 0.064 0.992 —0.015 0.127 0.857 —0.006 0.065 0.992 0.001 0.004 0.984 0.032 0.111 -0.036 0.112 

0.5 0.014 0.050 0.875 0.056 0.086 0.952 0.002 0.062 0.993 -0.015 0.121 0.869 0.000 0.067 0.992 0.000 0.004 0.985 0.152 0.182 -0.148 0.188 

30 0.0 0.008 0.043 0.927 0.031 0.065 0.960 0.000 0.064 0.992 —0.008 0.116 0.878 —0.004 0.062 0.993 0.000 0.004 0.984 —0.013 0.130 0.003 0.126 

0.2 0.007 0.041 0.934 0.034 0.069 0.958 —0.002 0.064 0.992 —0.015 0.114 0.878 —0.006 0.057 0.994 0.000 0.004 0.986 0.080 0.151 -0.095 0.151 

0.5 0.009 0.040 0.941 0.032 0.068 0.956 0.000 0.066 0.992 —0.008 0.112 0.872 0.000 0.058 0.994 0.000 0.003 0.987 0.270 0.299 —0.249 0.283 

500 15 0.0 0.004 0.024 0.968 0.010 0.033 0.989 0.002 0.027 0.999 0.000 0.052 0.973 0.001 0.027 0.999 0.000 0.002 0.997 0.004 0.043 0.004 0.043 

0.2 0.002 0.025 0.970 0.008 0.031 0.989 0.001 0.029 0.998 —0.002 0.053 0.969 —0.001 0.026 0.999 0.000 0.002 0.997 0.010 0.046 —0.010 0.044 

0.5 0.003 0.025 0.965 0.013 0.035 0.988 —0.002 0.029 0.998 0.000 0.052 0.970 —0.001 0.027 0.999 0.000 0.002 0.997 0.035 0.055 -0.030 0.052 

30 0.0 0.002 0.020 0.984 0.007 0.028 0.991 0.003 0.029 0.998 —0.002 0.053 0.971 0.000 0.027 0.999 0.000 0.002 0.997 0.000 0.042 —0.004 0.038 

0.2 0.002 0.019 0.985 0.007 0.029 0.991 0.000 0.028 0.999 0.000 0.051 0.972 —0.002 0.027 0.999 0.000 0.002 0.997 —0.001 0.042 —0.004 0.045 

0.5 0.003 0.019 0.986 0.006 0.027 0.991 0.000 0.029 0.998 —0.004 0.054 0.970 0.001 0.028 0.999 0.000 0.002 0.997 0.040 0.057 -0.037 0.054 

注 : N= 样本 量 ;I= 测验 长 度 ; CL = 交叉 载荷 ;g = 猜测 参数 ; s— 失误 参数 ;5= 时 间 强 度 参 数 ; o = 时 间 精 度 参 数 ; m = 视觉 强度 参数 ; 4= 视 
觉 区 分 度 参数 ; o = 作答 时 间 上 的 交叉 载荷 ;和 = 注视 点 上 的 交叉 载荷. 
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表 S3 模拟 研究 1 C-MCDM-D 模型 的 题目 参数 返 真 性 
g S 6 @ m d 中 入 
Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor Bias RMSE Bias RMSE 
100 15 0.0 0.016 0.051 0.894 0.037 0.077 0.948 0.001 0.084 0.985 -0.021 0.122 0.854 0.000 0.078 0.988 0.000 0.004 0.986 0.012 0.151 -0.002 0.148 
0.2 0.019 0.051 0.883 0.040 0.077 0.940 0.001 0.083 0.987 -0.014 0.118 0.870 -0.001 0.083 0.986 0.000 0.004 0.984 0.025 0.149 -0.018 0.150 
0.5 0.014 0.045 0.923 0.033 0.069 0.959 0.005 0.086 0.986 -0.013 0.124 0.825 0.009 0.073 0.989 0.000 0.003 0.982 0.029 0.152 -0.023 0.132 
30 0.0 0.013 0.044 0.925 0.031 0.068 0.954 -0.001 0.080 0.987 —0.020 0.114 0.871 0.000 0.075 0.988 0.000 0.004 0.987 —0.007 0.140 -0.001 0.135 
0.2 0.013 0.043 0.931 0.029 0.065 0.963 0.002 0.081 0.988 —0.020 0.113 0.873 0.002 0.076 0.989 0.000 0.003 0.987 0.012 0.139 -0.011 0.124 
0.5 0.010 0.039 0.939 0.028 0.067 0.954 0.009 0.081 0.987 —0.026 0.120 0.865 0.007 0.073 0.990 0.000 0.003 0.987 0.039 0.146 -0.035 0.136 
500 15 0.0 0.005 0.026 0.969 0.008 0.032 0.989 0.000 0.036 0.997 -0.001 0.054 0.972 -0.001 0.037 0.997 0.000 0.002 0.996 -0.004 0.072 0.004 0.066 
0.2 0.005 0.023 0.972 0.007 0.030 0.989 0.002 0.039 0.997 —0.006 0.055 0.965 0.003 0.034 0.998 0.000 0.002 0.997 0.002 0.073 -0.004 0.063 
0.5 0.003 0.021 0.979 0.009 0.029 0.992 0.001 0.037 0.997 -0.006 0.055 0.971 0.002 0.037 0.997 0.000 0.002 0.997 0.008 0.066 -0.011 0.065 
30 0.0 0.003 0.019 0.984 0.007 0.030 0.989 0.001 0.038 0.997 —0.002 0.053 0.970 0.003 0.034 0.998 0.000 0.002 0.997 0.001 0.065 -0.003 0.065 
0.2 0.002 0.019 0.984 0.007 0.028 0.992 0.003 0.037 0.997 —0.002 0.054 0.970 0.002 0.035 0.998 0.000 0.002 0.997 0.007 0.064 -0.007 0.060 
0.5 0.001 0.018 0.987 0.006 0.027 0.991 0.001 0.037 0.997 —0.002 0.053 0.972 0.002 0.035 0.998 0.000 0.001 0.997 0.006 0.064 -0.007 0.058 
注 : N= 样本 量 ;I= 测验 长 度 ; CL = 交叉 载荷 ;g = 猜测 参数 ; *= 失误 参数 ;5= 时 间 强 度 参数 ; wm = 时 间 精 度 参 数 ; m = 视觉 强度 参数 ; 4= 视 
觉 区 分 度 参数 ; 9 = 作答 时 间 上 的 交叉 载荷 ;入 = 注视 点 上 的 交叉 载荷 . 
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表 S4 模拟 研究 1 中 C-MCDM-C 模型 的 题目 参数 返 真性 
g S 6 0) m d 0) 入 
Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor Bias RMSE Bias RMSE 
100 15 0.0 0.015 0.049 0.894 0.054 0.089 0.948 0.003 0.119 0.974 —0.008 0.119 0.858 0.010 0.109 0.977 0.000 0.004 0.987 0.005 0.112 -0.007 0.106 
0.2 0.014 0.046 0.916 0.045 0.079 0.951 0.001 0.119 0.974 —0.029 0.120 0.837 -0.007 0.113 0.976 0.000 0.003 0.987 0.009 0.108 -0.008 0.112 
0.5 0.009 0.040 0.929 0.035 0.073 0.947 0.009 0.106 0.981 -0.021 0.121 0.864 —0.001 0.100 0.981 0.000 0.003 0.987 0.014 0.096 —0.012 0.188 
30 0.0 0.009 0.043 0.921 0.034 0.069 0.952 -0.007 0.108 0.977 —0.018 0.112 0.880 —0.010 0.101 0.980 0.000 0.004 0.987 —0.006 0.096 0.006 0.126 
0.2 0.013 0.040 0.944 0.029 0.069 0.953 0.010 0.107 0.977 -0.018 0.115 0.868 0.000 0.101 0.980 0.000 0.003 0.986 0.009 0.093 0.000 0.151 
0.5 0.012 0.041 0.935 0.029 0.065 0.958 0.017 0.104 0.980 —0.019 0.117 0.873 0.010 0.094 0.983 0.000 0.002 0.987 0.021 0.094 -0.018 0.283 
500 15 0.0 0.005 0.025 0.970 0.010 0.029 0.991 -0.002 0.051 0.995 -0.001 0.055 0.966 —0.005 0.051 0.995 0.000 0.002 0.997 -0.001 0.050 0.002 0.043 
0.2 0.001 0.022 0.973 0.007 0.029 0.991 0.000 0.048 0.996 -0.003 0.053 0.970 0.004 0.047 0.996 0.000 0.001 0.997 —0.003 0.046 -0.007 0.044 
0.5 0.003 0.020 0.983 0.009 0.030 0.991 0.008 0.049 0.996 —0.009 0.056 0.971 0.003 0.043 0.996 0.000 0.001 0.997 0.010 0.044 -0.003 0.052 
30 0.0 0.002 0.019 0.983 0.006 0.028 0.991 -0.001 0.047 0.996 —0.003 0.052 0.972 0.000 0.039 0.997 0.000 0.002 0.997 0.002 0.043 0.000 0.038 
0.2 0.002 0.018 0.987 0.006 0.027 0.991 0.004 0.047 0.996 —0.005 0.054 0.971 —0.001 0.043 0.996 0.000 0.001 0.997 0.006 0.041 -0.001 0.045 
0.5 0.002 0.018 0.988 0.006 0.027 0.991 0.001 0.048 0.996 —0.006 0.055 0.969 0.006 0.044 0.996 0.000 0.001 0.998 0.001 0.042 -0.006 0.054 
注 :N = 样本 量 ;I= 测验 长 度 ; CL = 交叉 载荷 ;g = 猜测 参数 ; s = 失误 参数 ;5= 时 间 强 度 参数 ; m = 时 间 精 度 参数 ; m= 视觉 强度 参数 ; d= 视 
觉 区 分 度 参数 ; e = 作答 时 间 上 的 交叉 载荷 ;入 = 注视 点 上 的 交叉 载荷 . 
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表 S5. 模拟 研究 2 中 潜在 能 


、 潜 在 加 工 速度 和 潜在 视 


觉 参 与 度 的 参数 估计 返 真 性 . 


数据 生成 模型 。 。 数据 分 析 模型 | i | . | 
Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor 
C-MCDM-0 H-MCDM 0.001 0.600 0.796 —0.001 0.137 0.961 0.001 0.217 0.912 
C-MCDM-9 0.001 0.239 0.972 —0.001 0.109 0.976 0.001 0.098 0.980 
C-MCDM-D H-MCDM 0.001 0.625 0.775 0.000 0.110 0.975 0.000 0.104 0.978 
C-MCDM-D 0.000 0.614 0.784 0.001 0.108 0.976 —0.002 0.083 0.986 
C-MCDM-C H-MCDM 0.000 0.625 0.775 —0.001 0.134 0.963 0.000 0.113 0.974 
C-MCDM-C 0.000 0.601 0.795 0.001 0.108 0.976 —0.001 0.087 0.984 
H-MCDM H-MCDM 0.000 0.571 0.817 0.000 0.108 0.976 0.000 0.082 0.986 
C-MCDM-0 —0.001 0.589 0.805 0.001 0.214 0.907 0.000 0.204 0.916 
C-MCDM-D 0.000 0.622 0.778 0.001 0.109 0.976 —0.001 0.082 0.986 
C-MCDM-C 0.000 0.622 0.779 0.000 0.110 0.975 0.000 0.083 0.986 
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表 S6 模拟 研究 2 中 题目 参数 返 真 


g s t m o d fai lamda 
数据 生成 模型 数据 分 析 模 型 

Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor Bias RMSE Cor 

C-MLDM-0 H-MLDM 0.003 0.019 0.986 0.004 0.027 0.992 0.000 0.028 0.998 0.032 0.047 0.995 -0.145 0.170 0.683 -0.004 0.007 0.952 
C-MLDM-0 0.003 0.019 0.986 0.004 0.027 0.992 0.000 0.028 0.998 -0.001 0.026 0.999 -0.007 0.053 0.970 0.000 0.002 0.997 0.003 0.035 0.996 0.002 0.032 0.995 

C-MLDM-D H-MLDM 0.002 0.019 0.984 0.006 0.027 0.991 0.020 0.072 0.988 0.056 0.108 0.968 -0.028 0.065 0.958 -0.002 0.004 0.981 
C-MLDM-D 0.002 0.019 0.984 0.005 0.027 0.991 0.002 0.036 0.997 0.001 0.036 0.997 -0.004 0.054 0.971 0.000. 0.002 0.997 0.003 0.062 0.969 0.004 0.062 0.982 

C-MLDM-C H-MLDM 0.003 0.020 0.984 0.005 0.028 0.991 0.139 0.292 0.821 0.138 0.281 0.789 -0.120 0.148 0.763 -0.003 0.006 0.967 
C-MLDM-C 0.003 0.019 0.985 0.004 0.027 0.992 0.004 0.048 0.996 0.003 0.045 0.996 -0.001 0.054 0.970 0.000 0.002 0.997 0.003 0.041 0.994 -0.003 0.039 0.992 

H-MLDM H-MLDM 0.003 0.021 0.983 0.007 0.028 0.991 0.000 0.028 0.998 -0.002 0.028 0.999 -0.002 0.052 0.972 0.000 0.002 0.998 

C-MLDM-0 0.003 0.021 0.983 0.007 0.028 0.991 0.000 0.028 0.998 -0.002 0.028 0.999 -0.001 0.052 0.972 0.000 0.002 0.997 


C-MLDM-D 0.003 0.021 0.982 0.007 0.028 0.991 -0.006 0.037 0.997 -0.005 0.037 0.997 -0.002 0.052 0.972 0.000 0.002 0.998 


C-MLDM-C 0.003 0.021 0.982 0.007 0.028 0.991 -0.018 0.051 0.996 -0.012 0.048 0.996 -0.002 0.052 0.972 0.000 0.002 0.998 


E: g = 猜测 参数 ; s = 失误 参数 ;5= 时 间 强 度 参数 ; @ = 时 间 精 度 参数 ; m= 视觉 强度 参数 ; 4 = 视觉 区 分 度 参数 ; e = 作答 时 间 上 的 交叉 载荷 ;入 = 注视 点 上 的 交叉 载 
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S2 MCDM 参数 估计 JAGS 代码 


# 篇 幅 限 制 ， 仅 呈现 C-MLDM-C ff] JAGS 代码 

# 对 C-MCDM-6 而 言 ， 仅 需 将 RT FC 测量 模型 中 的 inprod(attribute[n,], QI]) 蔡 换 为 theta[n,i] 即 可 

# 对 C-MCDM-D 而 言 ， 仅 需 将 RT 和 FC 测量 模型 中 的 inprod(attribute[n,], QI]) 蔡 换 为 prod(w[n,i,]) 即 可 
model 


for (n in 1:N) f 
for (iin 1:1) { 

Score[n, i] ~ dbern(prob[n,i]) #Score 题目 作答 精度 
for(k in 1:K){w[n,i,k]<-pow(attribute[n,k], O[i;k])? #attribute 属性 ; Q 矩阵 
prob[n,i]<-guess[i]+(1-slip[i]-guess[i])*prod(w[n,i,]) #guess 猜测 参数 ; slip Ki 
FC[n,i] ~ dnegbin(p[n,i], h[i]) #FC 注视 点 数 
p[n,i] <- h[i]/(h[i]* mu[n,i]) 
mu[n,i] <- exp(m[i]-amda[i]*inprod(attribute[n,], Q[i,])+epsilon[n]) # m 视觉 强度 参数 ; lamda 交叉 载荷 ; epsilon 潜在 视觉 参与 度 
logT[n, i] ~ dnorm(mu_logt[n,i], den_omega[i]) #logT 对 数 题 目 作 答 时 间 
mu, logt[n,i] <- zeta[i]-(tau[n]+phi[i]*inprod(attribute[n,],Q[i,])) # zeta 时 间 强 度 参数 ; tau 潜在 加 工 速度 ; phi 交叉 载荷 


e 
YE 


n 
for(n in 1:N){ 
for(k in 1:K){ 
logit(att_prob[n,k])<-gamma1[k]*theta[n]-gamma0[k] #gammal 属性 区 分 度 ; gamma0 属性 截 距 ; theta 高 阶 潜在 能 力 
attribute[n,k]~dbern(att_prob[n,k]) 


3} 
for (n in I:N) { 
theta[n] ~ dnorm(0,1) 
person_parameter[n, 1:2] ~ dmnorm(person_mu[1:2], prec.theta[1:2, 1:2]) 
tau[n] <- person_parameter[n, 1] 
epsilon[n] <- person_parameter[n ,2] 


} 
for (iin 1:1) { 
slip[i]~dbeta(1,1) 
guess[i]~dbeta(1,1) T(,1-slip[i]) 
zeta[i]~dnorm(4,0.5) 
m{i]~dnorm(4,0.5) 
h[i] <- 1/prec.h[i] 
v[i] <- mean(mu[;1])* (1/h[i])*pow(mean(mu[,1]),2) 
d[i] <- 1/sqrt(v[i]) #d 时 间 区 分 度 参 数 
den omega[i] ~ dgamma(1, 1) 
omega[i] <- sqrt(den omega[i]) #omega 时 间 精 度 参数 
prec.h[i] ~ dgamma(1,1) 
phi[i]~ dnorm(0, 2) 
lamda[i]-dnorm(0, 2) 


j 

for(k in 1:K){ 
gamma0[k]~dnorm(0,0.5) 
gamma1[k]~dnorm(1.5,0.5) T(0,) 

j 

person mu[1] <- 0 

person mu[2] «- 0 

R[1, 1] <- 1 

R[1, 2] <- 0 

R[2, 1] <- 0 

R[2, 2] <- 1 

prec.theta[1:2, 1:2]~dwish(R[1:2,1:2],2) 

Sigma person--inverse(prec.theta[1:2, 1:2]) 

r 1 2 <- Sigma person[1,2]/(sqrt(Sigma. person[1,1])*sqrt(Sigma. person[2,2])) #1r_1_2 加 工 速度 与 视觉 参与 度 之 间 的 (总 体 ) 相 关系 数 
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